音響イベント検出における事前学習済みモデル
Pre-trained Audio Neural Networks
YAMNet
Audio Spectrogram Transformer > AST
基礎のモデル
Bidirectional Encoder representation from Audio Transformers > BEATs
DCASE 2024で用いられていたのは以下
ATST
BEATs
PaSST