FLを踏まえて工夫を検討する
FLを踏まえて工夫を検討する
方向性は:
クライアントで完結しながらも,統合時に精度向上が可能
クライアントで用いるモデル自体の改良
採用する手法
クライアントで完結する
学習でしか使わない
推論時に不要
ローカルで録音したデータをさらに拡張
その必要性があるかは不明
エッジデバイスに要求するストレージがすごいことに...?
バッチごとにデータを拡張 > 学習
>これは後で調査. FLの時に調べれば良い.当面は素直に拡張して精度向上を観察する 半教師あり学習手法の一つとして挙げる
クライアントで実行し,ラベルなしデータを学習できるようにする
研究の手順
ベースラインを動かす + 実装
採用手法を実装し,精度を確認
精度向上が望めない場合,蒸留や量子化に移行
望める場合FLを適用し検証
24時間など,一定の期間の音声を保存
上書きする形で新しい音声を保存
結局それなりのストレージは必要そう
ひとまず加工をしない生音声データを保存?
処理の方法を色々試して決める