病理診断報告書作成のためのオントロジーを利用したテキスト入力支援
https://gyazo.com/1237405037597e5acc88f15c6e216fea
論文.icon
/nananana-icon/ウェブサイト.icon 言語処理学会 第 17 回年次大会 発表論文集 (2011 年 3 月) Web上にPDFあり。
nananana.icon テンプレート形式で出力した先で文章を最適化する方法を検討した論文
医療における病理診断報告書のテキスト入力を支援するシステムを提案した.従来のオントロジーを使ったテンプレート形式による入力支援と異なり,提案システムはテキスト入力時に構文解析器および意味解析器を動的に行いながら入力を支援することが大きな特徴である.
病理診断報告書はテキストの手入力により作成されているため,表記の揺れ,入力ミス,意味的に曖昧な表現などを多く含む.病理診断報告書のテキストを入力する際に,計算機がその入力を動的に解析し,入力作業を支援 (修正,補完,予測) することができれば,入力ミス等を減らすことができ,かつ解析済のデータを作ることができ,データの一次利用と二次利用の両面において価値を向上させることができるだろう.
これまでにオントロジーを用いた医療報告書の作成支援に関する報告
論文.icon 胸部写真読影における医学的知識に基づいたレポーティング支援システム. 第 26 回医療情報学連合大会論文集, pp. 1117–1118, 2006.
論文.icon 症例データベースから抽出した医学的知識のレポーティングシステムへの応用. 第25 回医療情報学連合大会論文集, pp. 962–965, 2005.
では,テンプレート形式を採用している.しかし、テンプレート形式では多様な診断結果に対応した報告書を作成することが困難であると考えられる.本論文では,オントロジーと構文解析器および意味解析器を用いて,胃癌に関する病理診断報告書の作成を支援する入力支援に関して報告する.
nananana.icon 診断規約ではそもそも定型の診断結果が求められているため、多様性は限定的です。このため、テンプレート形式で対応することが妥当と思われます。追記される所見についてはこの限りで無いため、この分野の発展が期待されます。
2 病理診断報告書
本研究では,連結不可能匿名化された病理診断報告書の「診断名」と「所見」を対象とする.診断名は,一般的には第1文で診断の結果すなわち病名を簡潔に記述する.次にその診断内容の詳細情報を記述する.
所見は,病理検体を観察し,その様子を詳細に記述する.一般的には,手術によって摘出された検体の場合,まず最初に摘出された検体全体の基本情報(部位,大きさ,質量など)を記述する.それに続いて肉眼で観察した際に発見された異常(病変)の個数や位置,状態を記述する.次に,顕微鏡を用いて細胞レベルで検体を観察した内容の記述を行う.所見には検体の詳細な状態を忠実に記述する必要があるため,自由入力を採用している.
実際の病理診断報告書を分析した結果、英語と日本語混じりのテキストが多く、文中に空白が挿入される場合が多い.また、空白の有無などによる表記ゆれも比較的多い.そのため、ステミング処理や形態素解析器などの処理を介して構文解析を行うよりも、余分な文字をスキップし,英語や日本語に関係なく分かち書きされてていない文として構文解析を行った方が効率的であると考え、MSLR パーザを採用した.
提案システムはテキスト入力時に構文解析器および意味解析器を動的に行いながら入力を支援することが大きな特徴である.
課題
辞書,文法,オントロジーといった知識のさらなる拡張
システムの入力支援の定性的・定量的な評価
文法やオントロジーをはじめとした知識を継続的に変更や改善をするためのメンテナンス方法