卒論のサーベイ
卒論に関する研究のサーベイ
研究分野: 主要な論文を書けてない
音声認識に関して軽くまとめた記事があった
マルチモーダルの言及があるらしい. しかしテーマは予知保全
基礎知識など
> SED関連モデル: 全然説明を書けてない + 主要な論文を挙げられてない sedのチュートリアル論文に途中までよくまとまっている
音響イベント検出をCNN + RNNで行う発想
CNN単独だとフレーム単位の情報だけを学習し,時間的な特徴が失われる
そこでRNNを後段に配置し,フレームごとに寸断された特徴について,時間的な解釈を行う
SEDを扱うCNNの情報を知りたい
Transformerに畳み込み層を追加したモデル