A Fully Convolutional Deep Auditory Model for Musical Chord Recognition
ShuKumata.icon
The problem the authors try to solve:
1枚まとめ
0. とりあえず一言
アブスト
Chord Recognitionの仕組みはロバストな特徴量抽出のパイプラインに依存している。このパイプラインは伝統的にはhand-craftedであったが、近年のend2endの機械学習の発展によって、研究者らはdata-drivenな手法を探索するようになった。本論文では、我々は特徴量抽出のためのfully convolutionalなdeep auditory modelを用いたchord recognitionの仕組みを提案する。抽出された特徴は最後のコードのsequenceをデコードするConditional Random Fieldによって加工される。この2つの処理stageは自動で学習され、最適化パラメータのexpert knowledgeを必要としない。We show that the learned auditory system extracts musically interpretable features, and that the proposed chord recognition system achieves results on par or better than state-of-the-art algorithms.
time-frequencyな表現に変換し、CNNで特徴量抽出。
1. どんなもの? 問題意識は?
2. 先行研究と比べてどこがすごい?
3. 技術や手法のキモはどこ?
4. どうやって有効だと検証した?
5. 議論はある?
6. 次に読むべき論文は?
7. メモ
8.コメント
リンク