wavenet
wavenetは、googleが提案する音声波形接続方式の音声合成ネットワークです。
音声波形接続方式は分析合成方式よりも音質がよく、肉声感が出る方式だった。
ただし、大規模な音声波片データベースが必要になる。
wavenetは音声を入れると、その音声を真似して合成してくれる。
すごいのは、従来の音声波形接続方式よりも遥かに音質の良い音声が作れること。
この技術は「ok, google」でおなじみのgoogle アシスタントに使われています。
研究
音声から音声を出力するEnd-to-Endの合成器である。
どうやって学習するのだろうか?
補助特徴量を入れることで音質を向上させる研究がある。
補助特徴量が可能であれば、声質変換や感情音声合成にも使える?