RVC用の学習データの整形
やることとしては下記。
データ集め
iPhoneで録音するなり、Youtubeの動画を引っこ抜いてくるなり何でも良い。
ボイスの録音はこのサイトがクソ便利
適度なサイズに切る(~10秒くらい)
これを使うと切断が簡単にできる
無音の部分を削除
コマンドは sox -V3 input.wav out.wav silence -l 1 0.4 0.1% 1 0.4 0.1%: newfile : restart
m4aをwavに変換するには下記で一気に行ける
code:sh
for f in ls *.m4a; do afconvert -f WAVE -d LEI16 $f waves/${f%.m4a}.wav; done
これを繰り返す!とにかくだるい!!!