MELODY GENERATION FOR POP MUSIC VIA WORD REPRESENTATION OF MUSICAL PROPERTIES
なぜその論文を選んだか
・音楽を言葉としてとらえるという発想が気になったから
どんなものなのか
・音を言葉としてとらえ曲を音(言葉)が連なった文章としてとらえ処理する
・生成された旋律が人間が理解しやすい音程範囲にとどまるような正則化のアルゴリズム
先行研究と比べてどこがすごいのか
・音を言葉としてとらえる発想とそれが結果に結びついている点
・和音の効率的な実装
手法のキモ
・今まで曲を等間隔で区切って処理を行ってきたがこれでは特に音符のない部分で単純に前の部分を繰り返し学習する可能性が高いが、単語とて認識し文章として出力することで考慮する必要がなくなった。これは和音の生成時にも有利に働く。https://gyazo.com/5cbaff9f9eb1f02c32b3fcce78c5b372
・生成されたメロディと予め決められた音程範囲内の音符の間の絶対距離に比例してペナルティが与えられる(歌手の好みに応じて最大音程と最小う音程を変更可能)https://gyazo.com/ae1b5efa22dfcc612d4c6c7400ec0f98
どうやって有効性を検証したか
https://gyazo.com/e9a52f50583c83ec6328f51fba9036b5
・Amazon Mechanical Turk上で2つのアンケートをとった
1つ目は今までの音楽生成AIと比較してどちらが音楽として優れているかのアンケート
2つ目は実際に生成した音楽が人間が作ったのかAIが作ったのかどちらに聞こえたかのアンケート
議論
・音の強弱やビブラートなど様々な技術の実装が未達成
・他のジャンルでも通用するのかの検証
・過学習による著作権侵害の懸念