医療応用における計算知能とmodeling
東北大学 本間経康(March 9, 2022)
発表概要
深層学習は性能が高いので臨床応用への期待が高く、実際導入が始まっている。しかし、modelingの観点からはいろいろと問題があり、本格導入に際して障害になりかねない。
例えば、画像再構成(物理的測定から所望の画像を作ること)では、実際に撮像しなくても、撮像したものに近い画像を作り出すことができてしまう。これは、種となる物理的に撮像した画像を入力とし、それとは異なる条件で撮像したときの画像を推定する、いわゆる関数近似の問題として定式化可能であり、深層学習の驚くべき近似能力が報告されている。ただし、撮像の物理的機序を学習できていないことは明白。
いわゆる実験則の近似には長けているが、その背後にある理屈や機序を発見するのは苦手だし、それを明示的に表現する道具は未発達という意味で、blackbox。
画像診断の例でも同様。診断結果(入力画像と診断結果の写像関数の近似)は良いが、何故そう診断したかの説明は苦手。
したがって、平均的には専門医を凌駕する高性能を示す例も報告されているが(これ自体は純粋に驚き!)、専門医では考えられない間違いを犯しうるし、実際そうなる。→統計的に十分な訓練で解決可能なのか(そもそもそのような訓練は医療分野で可能なのか)を考える必要あり。
以上を踏まえ、画像再構成でも画像診断でも、その機序を解析することで、深層学習がどのようなmodelを構築(パラメータ調整なので実際には同定)しているか説明する研究が盛んである。
第一歩として、出力に寄与する入力画像領域を可視化する技術が開発され、それなりの成果が報告されている。
可視化によって分かってきたのは、専門医とは似て非なる機序(近似関数)を学習しているという事実。ある意味予想通り。
最後に、呼吸制御を題材として、静的な入出力関数の近似ではなく動的なシステム制御の問題を紹介。こちらはまだCIまで研究が進んでいないが、対象(生体)の非線形性はCI的なmodelingへの期待が大きい。
システム同定から制御器の設計まで、制御工学の基礎的な内容だが、対象が生体だとそれなりの(多少強引な)工夫が必要。
基礎的な内容なので、modelの説明としては非常に分かりやすい(深層学習と比べるとホッとする)。
ご質問内容
画像診断における入力は前処理、たとえば病変が関与していそうな関心領域の切り出しなどをするのか
そうする場合もあるが、切り出しをせず画像全体を入力する場合もある。問題としては切り出した方が簡単なので、有効な場合が多い。しかし、切り出すこと自体が難しかったり、それにより抜け落ちてしまう情報(周辺との関連など)もあるので、一般には臨床における読影に近い条件で問題設定を要求されることが多い。
学習によって獲得された寄与領域を可視化することで機序(近似関数)を説明しようとしているが、可視化の段階で情報が抜けてしまわないか。
その可能性はある。また、可視化技術自体も幾つかあり、入力画像の何を「寄与領域」と定義するかは技術ごとに異なる。この意味で、ある側面でしか可視化できていない。
CIとmodelingの方向性に関する私見
深層学習に限定すると、やはり物理的機序のmodelingが安全性や信頼性の意味でも、また性能面でも重要。とくに臨床応用では最重要課題の一つ。そのための核は、いわゆる正則化技術、たとえば学習で獲得する機序(modeling)に尤もらしい制約を付加する技術であると予想する。
とくに医療分野では、たとえば希少疾患など、そもそも統計的に十分な訓練を行うことが難しい課題もあり、機序に裏付けられたmodelingは極めて重要。
対象範囲
医用画像、生体情報など