HAR-FLの課題
from 施設内の行動認識をサーベイ
FLでのHARにおける種々の課題
データ関連
異種性, Non-IID
クライアントによって拾える音が異なることが容易に想定される
データの分布が全く異なる
ラベル希少性
目的達成のために十分なデータがない
データに含まれるノイズやラベルの誤り
クライアントの拾う音はノイズが多く含まれていると想定される
ラベル付が正しくできるか不明
データ不均衡
何らかの音響イベントが稀だとデータが不均衡になる...と言っている
少数クラスの検出性能が低下する
問題はクライアントごとのデータのばらつきだけではないのだな... 知見を得た
モデルやアルゴリズム
通信効率
通信帯域幅や遅延が問題
モデル圧縮 / 勾配量子化 / スパース更新など
計算資源の制約
IoTデバイスは資源が乏しい
計算能力
メモリ
電力,バッテリー
軽量なモデルの構築 | 採用 / 連合分割学習(FSL)
モデルの汎化
新しい環境やユーザに適応できるか
事前学習済みモデルを用意し,クライアントで学習させるとか?
リアルタイム処理
推論速度や遅延の最小化が必要
プライバシー・セキュリティ
勾配漏洩攻撃
PETのオーバーヘッド
必要資源と担保のバランスを考える
ポイズニング攻撃,敵対性攻撃
そんなやついる?
意図せず乱すとかなら分かるが
乗っ取られとかかな
信頼できる実行環境, TEEの欠如
これ言葉合ってるのかね
クライアントがやられた時,データやモデルを守れるか
実装や展開
標準化がない
ユーザ受容性と信頼
透明性が必要
ユーザによる設定の話は微妙
ユースケース次第では
スケーラビリティ
1施設内で完結するFLシステムであれば不要?
多数の施設に配備することを考えると必要になりそう
その場合,一つ統合モデルを立て,そこから集約することになりそう
保守と更新
確かに重要だが,今考える問題でもない気がする
遠大すぎる
倫理的配慮
データ最小化はそもそも行う
バイアスは起こり得ない
透明性とか説明可能性は後回しかな