卒論で何をどのくらい理解するか考える
from
DCASEのベースラインを動かす_ログ
卒論でどこをどのくらい理解する必要があるか考える
卒論で行うSEDの工夫
について
課題は何? 必要な知識は?
?
DCASE 2024
ベースラインの仕組みは?
*
PytorchとPytorch Lightningを学ぶ
,
野生のモデルを飼い慣らす
動かしながら理解
ベースラインの学習や工夫の検証を行いつつ,適宜調査
パラシュート学習法
を実施
!
ベースラインにクロスアテンションを組み込む
*
クロスアテンションとその実装
>
ベースラインにFDY Convを組み込む
?
学習手法は? どのように学習する?
Confident Mean Teacher
が第一候補
*
ベースラインと下報告書を確認,必要なら調査
cf.
LOCAL AND GLOBAL FEATURES FUSION FOR SOUND EVENT DETECTION WITH HETEROGENEOUS TRAINING DATASET AND POTENTIALLY MISSING LABELS
?
GRUとConformerの入れ替えは有効か
*
CRNN
,
GRU
,
Conformer
?
Conformer
系列でさらに良いモデルは何か >
Deep Research
*
Efficient Conformer
,
Branchformer
?
Squeezformer
は新しいか
?
Branchformerまでの流れの先に事前学習モデルとCNNの統合がある?
?
時系列デコーダとしてConformerとMambaのどちらが良いか
*
Mamba
cf.
Conformer
の
Deep Research
適切な構成を考えた上で実験する
?
ブランチの片側にBEATsを使うのは適切か
*
BEATsはどういう学習法か
?
適切なデータ拡張は何か
*
データ拡張手法,拡散モデルによる拡張
何をどこまでやる?