音響イベント検出における事前学習済みモデル
Pre-trained Audio Neural Networks
YAMNet
Audio Spectrogram Transformer
>
AST
基礎のモデル
Bidirectional Encoder representation from Audio Transformers
>
BEATs
DCASE 2024
で用いられていたのは以下
ATST
BEATs
PaSST