音響イベント検出

卒論は結局これ一本だったが, 今後も継続するかは検討が必要

非常にやりづらい領域な気がしている

画像的なアプローチを続けるなら, 類似分野である物体検出の方でも何か研究することになりそう

それこそ気になっている姿勢検知系の何か

実環境での運用のために問題が山積みで, それらを対象に取って研究を進めるのが筋が良さそう?

特にモデルのサイズと計算リソース, 推論速度の兼ね合い, プライバシーの保護, マルチモーダルなど

根本的に音が実環境で使いづらいという問題も残されている

多分そうだよね. チュートリアルにもそう書いてあるし

もう少しやってもいいな. まだやり切れてないし, ネタは色々ありそうだし

これから別の分野に転向すると, そちらの学習をほぼゼロから始める必要がある. 正直しんどい

まだ全く研究の抽象的なスキルが身についてない. それに, 基礎も全く出来上がってない

今はまだそれらを固める段階だと思っている. その上で, 何かしら成果が出せれば御の字

方向性としては, DCASEで検討されてない領域を研究するという感じか. 色々あると思うが, 他で検討されている可能性もあるのでサーベイが必要

そもそも音響イベント検出の理解とサーベイが不十分. せめて日本で一番この話には詳しいレベルまで磨き上げた方がいいのでは

元の目的は安価な見守りだったか? その辺り含めて見直しが必要そう. ストーリーが雑すぎる. 結局何を研究すれば良いのか, 全くまとまってない