人ではないと見破れない
https://www.nicovideo.jp/watch/sm39978802 https://gyazo.com/dc033aacfda1dbfa68d96f02239abda4
https://youtu.be/VIJ5WRUDe-A
そろそろ歌はわからない領域に達しつつある
聞き慣れていれば合成音声の特徴が学習できているからわかるけど
事前知識を抜いて聞いた時、わからない人は3割ぐらいいそう
人間の声を加工してこういう曲を作って混ぜ込んで判定しろとなったら5割ぐらいに増えそう
https://www.nicovideo.jp/watch/sm42180810 https://img.cdn.nimg.jp/s/nicovideo/thumbnails/42180810/42180810.62172389.original/r1280x720l?key=8b3391ed3bdd480fbb14c9ff518384320c7be0ef5abc6a982b24e3facfccecad#.png
【夏色花梨】完璧で究極の「アイドル/YOASOBI」を歌ってもらった【推しの子】【SynthesizerV AI】 - ニコニコ動画
↑になるときの処理
3DCGは写実的なものはよく見ないと騙される領域に達している
人ではないと見破られないコツ
加工されていることが前提のフォーマットを使う
人間が機械に寄せるので機械が人間に寄せる時にハードルが楽になる
シンガーは音程を合わせるツールを使って音を合わせる
あえて見破りやすい機械を入れる
古典的な合成音声をコーラスに入れる