音響イベント検出における事前学習済みモデル - main-custard

音響イベント検出における事前学習済みモデル

Pre-trained Audio Neural Networks

Audio Spectrogram Transformer > AST

基礎のモデル

Bidirectional Encoder representation from Audio Transformers > BEATs

DCASE 2024で用いられていたのは以下