FLを踏まえて工夫を検討する
from 卒論におけるSEDの工夫を考える
FLを踏まえて工夫を検討する
壁打ち >
方向性は:
クライアントで完結しながらも,統合時に精度向上が可能
クライアントで用いるモデル自体の改良
採用する手法
Cross-Attention
クライアントで完結する
Auxiliary Decoder
学習でしか使わない
推論時に不要
Data Augmentation,データ拡張
ローカルで録音したデータをさらに拡張
その必要性があるかは不明
エッジデバイスに要求するストレージがすごいことに...?
On-the-fly Augmentationで解決
バッチごとにデータを拡張 > 学習
>これは後で調査. FLの時に調べれば良い.当面は素直に拡張して精度向上を観察する
cf. https://www.codexa.net/data_augmentation_python_keras/
Confident Mean Teacher
半教師あり学習手法の一つとして挙げる
クライアントで実行し,ラベルなしデータを学習できるようにする
2025/7/25 研究の面談で上がった課題の解決にもつながる
研究の手順
ベースラインを動かす + 実装
採用手法を実装し,精度を確認
精度向上が望めない場合,蒸留や量子化に移行
望める場合FLを適用し検証
> データ保存の懸念
リングバッファ形式で解決?
24時間など,一定の期間の音声を保存
上書きする形で新しい音声を保存
結局それなりのストレージは必要そう
ひとまず加工をしない生音声データを保存?
処理の方法を色々試して決める