Music Dataset
#Dataset
音楽に用いるデータセット
著作権の話
「歌詞」「メロディ」「録音された音源」に著作権が発生する
https://www.businessinsider.jp/post-987
ただし、機械学習のデータとして用いるのは問題ない?
https://storialaw.jp/blog/4936
https://www.midiworld.com/
MIDIが2000弱ある?
http://millionsongdataset.com/
100万曲分
ただし、メタデータにMIDIとかコード進行はなさそう?
この曲は誰の曲で、キーは何で、とかそういう感じのデータっぽい
https://www.hooktheory.com/
頑張ったらメロディとコードのセットのデータが取れるかもしれないけど、APIは公開されてない
https://api.hooktheory.com/v1/songs/public/AaoGnqYJxeQ?fields=ID,xmlData,song,jsonData
public以降のIDが不明
Googleさんのデータセット
https://magenta.tensorflow.org/datasets
MAESTRO
NSynth
http://isophonics.net/datasets
Audioとコード進行のアノテーション(この時間からこの時間はG7、みたいな)
200曲
https://qiita.com/xiao_ming/items/c25642d9d095964410fd
Youtube-8M
#詳細は後日更新
https://sigsep.github.io/datasets/musdb.html#musdb18-compressed-stems
#詳細は後日更新
https://ddmal.music.mcgill.ca/research/SALAMI/
#詳細は後日更新
有料MIDI
プリント楽譜
https://www.print-gakufu.com/midi/
ヤマハミュージックデータ
https://yamahamusicdata.jp/
以下 https://github.com/arXivTimes/arXivTimes/tree/master/datasets より引用
The Largest MIDI Collection on the Internet
公開されているMIDIデータを収集した大規模なデータセット(※もちろん有料なコンテンツは含まれない)。
ポップ、クラシック、ゲーム音楽など多彩なジャンルで構成されており、総ファイル数13万・約100時間分のデータとなっている。
Tronto大学のSong From PIで使用されたデータセット
https://www.reddit.com/r/WeAreTheMusicMakers/comments/3ajwe4/the_largest_midi_collection_on_the_internet/
The MagnaTagATune Dataset
TagATuneというゲームを通じて音楽データを収集する試みにより、Magnatuneという音楽サイトから収集されたデータセット。
約3万曲に対し、音楽ジャンルなどのタグが付与されている。
http://mirg.city.ac.uk/codeapps/the-magnatagatune-dataset
The NES Music Database
ファミコンのゲーム楽曲を収録したデータセット。397タイトルの計5278曲が含まれる。
アセンブリから楽曲再生にかかわる部分を抽出し(いいのか?)、MIDIを始めとした扱いやすい形式に変換している。制限された音階/楽器をうまく組み合わせているので、学習に良いとのこと。
https://github.com/chrisdonahue/nesmdb
Yamaha e-Piano Competition dataset
公式にデータセットとして配布されているわけではないが、YAMAHAのジュニアコンペティションで実際に演奏されたピアノのMIDIデータが公開されている。Performance RNNで使用されていたデータセット。
http://www.piano-e-competition.com/midi_2004.asp