人ではないと見破れない
https://youtu.be/VIJ5WRUDe-A
そろそろ歌はわからない領域に達しつつある
聞き慣れていれば合成音声の特徴が学習できているからわかるけど
事前知識を抜いて聞いた時、わからない人は3割ぐらいいそう
人間の声を加工してこういう曲を作って混ぜ込んで判定しろとなったら5割ぐらいに増えそう
↑になるときの処理
3DCGは写実的なものはよく見ないと騙される領域に達している
人ではないと見破られないコツ
加工されていることが前提のフォーマットを使う
人間が機械に寄せるので機械が人間に寄せる時にハードルが楽になる
シンガーは音程を合わせるツールを使って音を合わせる
あえて見破りやすい機械を入れる
古典的な合成音声をコーラスに入れる