卒論で何をどのくらい理解するか考える
from DCASEのベースラインを動かす_ログ
卒論でどこをどのくらい理解する必要があるか考える
卒論で行うSEDの工夫について
課題は何? 必要な知識は?
? DCASE 2024 ベースラインの仕組みは?
* PytorchとPytorch Lightningを学ぶ,野生のモデルを飼い慣らす
動かしながら理解
ベースラインの学習や工夫の検証を行いつつ,適宜調査
パラシュート学習法を実施
! ベースラインにクロスアテンションを組み込む
* クロスアテンションとその実装
> ベースラインにFDY Convを組み込む
? 学習手法は? どのように学習する?
Confident Mean Teacherが第一候補
* ベースラインと下報告書を確認,必要なら調査
cf. LOCAL AND GLOBAL FEATURES FUSION FOR SOUND EVENT DETECTION WITH HETEROGENEOUS TRAINING DATASET AND POTENTIALLY MISSING LABELS
? GRUとConformerの入れ替えは有効か
* CRNN,GRU,Conformer
? Conformer系列でさらに良いモデルは何か > Deep Research
* Efficient Conformer,Branchformer
? Squeezformerは新しいか
? Branchformerまでの流れの先に事前学習モデルとCNNの統合がある?
? 時系列デコーダとしてConformerとMambaのどちらが良いか
* Mamba
cf. ConformerのDeep Research
適切な構成を考えた上で実験する
? ブランチの片側にBEATsを使うのは適切か
* BEATsはどういう学習法か
? 適切なデータ拡張は何か
* データ拡張手法,拡散モデルによる拡張
何をどこまでやる?