音響イベント検出におけるクリップとフレームの意味
クリップは一定時間で切った音のこと?
イベントが含まれる音声のこと
一定の時間で大まかに何のイベントが存在しているか認識
フレームはクリップの一部分のこと
クリップをさらに細かく分割し,どんなイベントが含まれているかを捉える
イベントの細かな発生タイミングを取る
フレーム(強ラベル)とクリップ(弱ラベル)の両方の結果を用いて音響イベント検出を行う
弱ラベルから強ラベルを推定する
audio tagging (AT) to guide a student for SED
Guided learning for weakly-labeled semi-supervised sound event detection
強ラベルは本題の音響イベント検出に使用