院試用研究計画書の背景を再考する
現時点で結構おかしな部分が見受けられる
サーベイとそこで得た情報による修正が必要
見守りではなく在宅介護を意識した内容に変更する
今一度考えてみる
近年,世界的に高齢化が進行しており,合わせて少子化も進んでいる.ここで,自立的な行動が難しく,介護が必要な人を要介護者,介護を行う人を介護者とする.高齢化の進行で要介護者が増加し,少子化によって全体の人数が減り,介護者が少なくなる.実際に介護を業務として行う介護従事者も減少傾向にあり,小子高齢化と合わせて,2030年にはかなり負担が増大するという試算が出ている\1.
他方,我が国に目を向けると,少子高齢化はもちろん,介護従事者の減少も他の先進国と同様に進行している\2.特に,介護従事者は平均的な給与が低い上に労働量が多く,成り手があまりいない状態にある\3.介護従事者の増加が見込めず,むしろ離職などで減少していき,要介護者に対する介護従事者の割合は低くなる.つまり介護者一人当たりの労働量が増え,負担が大きくなる.仮に負担が増加しても,給料は据え置きか多少改善される程度のため,成り手はさらに少なくなる\4.介護従事者は,負担の増大と労働環境の悪化,成り手の減少という悪循環に陥っていると考えられる.
自動化を軸に据えているが、自立生活支援を軸にした方が良さそう
他方,昨今は情報技術の発展により,色々な自動化が進んでいる.例として,会計の自動化がある\6.これはある小売店舗で,店に入って商品を選び,袋に詰め,会計をしないでそのまま外に出れる,というものだ.Amazonが実際に行っており,入店時に一度ユーザの照合を行い,後はカメラや商品についた電子的なタグによって何を買ったか確認し,退店時には自動で請求などの会計処理を終える\6.この他,料理や清掃,警備,工場における各種機器の確認など,様々な業務の自動化が実際に行われている\7.現状の自動化は完全とは言えないが,今後の発展で更なる人の労働量削減に貢献すると思われる\7.
介護従事者の陥っている問題の根本は,労働力不足である\5.外国の労働力を受け入れることがまず考えられるが,それでは他所から人が移動しているだけで,必要な労働力の削減に繋がらない.そこで,介護現場における業務の自動化を考える.介護における業務は主に要介護者の行動補助や,要介護者や施設の見回り,消耗品の補填などが考えられる\8.この内,見回りに着目する\9.見回りは施設の各部屋に趣き,要介護者が安全な状態にあるかを確認する\10.特に夜の見回りは介護者の夜勤を必要とし,負担が大きい\9.見回りを機械で補助し,危険な状態にある要介護者を自動的に通知することができれば,見回りに必要な人数が減り,介護者の負担を少なくできる.
以下,若干技術的な話も入る
機械で介護者の状態を把握するため,人の行動認識(Human Activity Recognition, HAR)を用いる.これはカメラやマイクといった一般的な道具から,加速度センサや無線など,多様なセンサを使い,人の行動に関する情報を得て,どういった行動を取っているか,あるいは状態にあるかを推測する技術である\11.HARでは日常生活動作(Activities of Daily Living, ADL)という,日常的な動作を介護者が行えているかを確認し,要介護者の自立の度合いや状態を見る研究が多数ある\12.これらはカメラやマイクなど,多様なセンサを用いて行われている.また,咳込みの音から症状の重さを解釈したり,行動の異常さを見て認知機能の衰えを推測するなど,一般的な動作の他に,行動や状態が異常性を確認する研究もある\13.
見回りの業務は,介護者一人一人の見守り,監視とも言える.介護における見守りについて,既存のシステムがいくつか存在し,実際にそれらを導入して効果を上げている介護施設が複数存在する\14.しかし,導入率は然程高くないのが現状である\15.この理由として,介護向け見守りシステムの初期費用の高さがある.既存のシステムはカメラを何台も使用して動作させており,それら機器は部屋ごとなど複数必要になるため,購入による費用が嵩む\16.
介護における見守りを安価に実現するべく,音によるHARの適用を考える.要介護者の発する危険の兆候として,咳き込みや呼吸など,音特有のものがある\17.音からADLを推測する研究も多くあり,要介護者の動作を見て,いつもと違う行動を取っているか判断することも考えられる\18.また,カメラを何台も設置するより,マイクを設置する方が費用が低く抑えられる\19.
ここにHARをどう実現するかのパラグラフが入る
機械学習登場以前と以後の手法をまとめ,どう実現するか述べる
以降は機械学習を前提に記述する:
機械学習の出現でHARが変わったという旨の論文を一旦信じる
後でこの点は調べよう
一方で,HARを機械学習で実現する場合,プライバシの問題がある.データをその場に留めて学習するなら問題ないが,仮にデータを一箇所に集約し,機械学習などに用いる場合,避けられない問題となる\20.そこでFL(Federated Learning, 連合学習)の適用を考える.FLはデータをその場に留めたまま学習を進められる手法で,要介護者ごとにデバイスを設置し,それぞれで得られるデータを活用したモデルの構築が可能となる\21.
機械学習によるHARにFLを適用する場合,プライバシーの問題は緩和されるが,その他HARやFLに存在する課題が残る.一つはデータ異質性である.今回の想定ではクライアントごとにデバイスを設置し,FLに参加するが,録音環境や要介護者の行動などがそれぞれ異なるため,データ分布に偏りが生じ,推論精度が低下する恐れがある.もう一つはデータ不均衡である.異常なイベントは稀であり,クライアントで録音される数はかなり少なくなる.そういった,ごく少ないラベルが含まれるため,その対応が必要となる.最後に音特有の問題がある.音が重なっても,行動を正しく識別する必要がある.また,音のしない行動の推測は難しい.
最後に,研究で行うことを述べる? > ちょっと微妙. ほとんど技術的に何をするかの説明になった
本当はここで第n節ではhogehogeを説明する,とか述べたい
マルチラベル音響イベント分類を元にラベル付けをし,異常検知を行う.これにFLを適用することで,様々なクライアントのデータを学習し,より高性能なモデルの実現を目指す.
モデルは推論時,与えられた音声データからイベントを検出し,一定の閾値で可能性があるとされたイベントを該当する時間帯にラベル付けする.ラベル付けされた音声データを元に異常検知を行う.
学習では,推論時に蓄積した音声データを元に,半教師あり連合学習を行う.半教師あり学習は少量のラベル付きデータを元にラベルのないデータを扱う学習手法である.これによってラベルのない大量のデータを学習に利用する.
モデルの学習や推論時に課題となる,データの偏りや不均衡は,それぞれ偏りに対応する集約方法や,少量のラベルデータを強調する損失関数の使用などで対応する.また,音の重なりについては,通常のマルチクラス分類ではなくマルチラベル分類を行うことで,同時に発生する音響イベントの識別を可能にする.
引用と引用が必要そうなところ + コメント
\1
! 世界的に介護従事者が減少傾向にあり,負担が増大するという試算の資料を探す 手元にある国連や国際的な経済,医療の資料が参考になる?
\2
! 日本の少子高齢化と介護従事者の減少傾向や負担増大の資料を探す \3
特に介護従事者の資料
\4
介護従事者の給料が増えていないことを示す資料
\3の一部
\5
1,2,3,4のどれかでもいい
つなぎ方がおかしいかも
\16
\17
\19
! 見守りシステムに用いるカメラとマイクを比較して費用を確認 他
より狭い範囲で限られた役割を果たすサービスや商品が存在
それらに関する検討,差別化が欲しい