Music Dataset
音楽に用いるデータセット
著作権の話
「歌詞」「メロディ」「録音された音源」に著作権が発生する
ただし、機械学習のデータとして用いるのは問題ない?
MIDIが2000弱ある?
100万曲分
ただし、メタデータにMIDIとかコード進行はなさそう?
この曲は誰の曲で、キーは何で、とかそういう感じのデータっぽい
頑張ったらメロディとコードのセットのデータが取れるかもしれないけど、APIは公開されてない
public以降のIDが不明
Googleさんのデータセット
Audioとコード進行のアノテーション(この時間からこの時間はG7、みたいな)
200曲
有料MIDI
プリント楽譜
ヤマハミュージックデータ
The Largest MIDI Collection on the Internet
公開されているMIDIデータを収集した大規模なデータセット(※もちろん有料なコンテンツは含まれない)。
ポップ、クラシック、ゲーム音楽など多彩なジャンルで構成されており、総ファイル数13万・約100時間分のデータとなっている。
Tronto大学のSong From PIで使用されたデータセット
The MagnaTagATune Dataset
TagATuneというゲームを通じて音楽データを収集する試みにより、Magnatuneという音楽サイトから収集されたデータセット。
約3万曲に対し、音楽ジャンルなどのタグが付与されている。
The NES Music Database
ファミコンのゲーム楽曲を収録したデータセット。397タイトルの計5278曲が含まれる。
アセンブリから楽曲再生にかかわる部分を抽出し(いいのか?)、MIDIを始めとした扱いやすい形式に変換している。制限された音階/楽器をうまく組み合わせているので、学習に良いとのこと。
Yamaha e-Piano Competition dataset
公式にデータセットとして配布されているわけではないが、YAMAHAのジュニアコンペティションで実際に演奏されたピアノのMIDIデータが公開されている。Performance RNNで使用されていたデータセット。