VOICEPEAK調教メモ
人間が話す時は必ず「伝えたいこと」があるはずである。伝えたいことがある限り、セリフのうちどの部分を伝えたいか=重要か、あるいは重要でないかの差が出来るはずである。重要な単語、言葉は【強調】すれば「もっと【伝わる】」はずである。
VOICEPEAKはAIといっても、テキストの「意味」を読み取っているわけではないため、セリフのどの部分がどれだけ重要か、それがどういう効果を持つかを理解しているわけではない。
なので人間(ユーザー)がやるべきことは「文脈を理解して、どの部分を【強調】していくか」である
強調すべき箇所の例
例文「コンビニでおにぎりを買いました。」
「どこで」買ったかが重要なら「コンビニ」を強調する。
「『コンビニ』でおにぎりを買ったんだけど、そのコンビニでさ…」
ただしこの場合は「おにぎりを買いにコンビニに行ったんだけど…」のほうが自然。
「何を」買ったかが重要なら「おにぎり」を強調する。
「コンビニで『おにぎり』を買ったんだけど、そのおにぎりがさ…」
例外として「強調する機能を持つ単語」は、強調される名刺ではなくその単語を強調すべきときがある。
とっても大きく育ちました。→文脈としては「大きく」が重要だが、「とっても」のほうを強調する。
誠に遺憾である。
このジュースマジで美味いから。
カドに足をぶつけてクッソ痛い。
強調の方法
重要な単語を強調する
重要な単語の音程を一段上げてみる
重要な単語の抑揚をより強くつけてみる
重要な単語の頭の音の長さを長くしてみる
重要な単語の頭の前に空白(句読点、無音区間)を入れてみる
重要でない部分の音程を一段下げる、あるいは平坦にする
重要な単語の音声を一段上げてみる
重要な単語は重要でない単語より一段音程を高くする。
重要な単語の抑揚をより強くつけてみる
抑揚をつける。上げるアクセントならより上げ、下げるアクセントならより下げる。つまり、音程の上下の幅を広げる。
VOICEROIDには抑揚というパラメータがあってそれなりに便利だったが、VOICEPEAKには無い。個人的にはイントネーションと抑揚という、内部的には同じ効果を持つ(どちらもピッチをいじっている)パラメータが2つあるのは混乱の元なので、ひとつに統一されている現状のほうが使いやすいと感じている。
重要な単語の頭の長さを長くしてみる
単語の頭を伸ばすとリズムが崩れ、聞き手がそこが気になる。単語の頭を伸ばすことで聞き手の「気を引く」のである。
例「おおきな木」→「お~おきな木」
逆に単語の終わりを伸ばしても強調という意味ではあまり効果がない。単語終わりを極端に伸ばすことは強調よりもむしろ感情を入れる手段として有効(後述)
重要な単語の頭の前に空白を入れてみる
単語の頭に空白があると強調される。例えば読点「、」など。
長文を休みなく一気に読まれると聞き手は「息苦しく」感じる。それはセリフに呼吸が感じられないからだ。
実際に呼吸音が発せられるかは別として、空白は擬似的に「呼吸」を再現できる。息を吸ったあとは強い発声が出来るため、音程にも強さが現れる。
また「タメ」の効果もあるため、聞き手は次の単語に自然に注目するようになる。音楽のブレイクと同じ。
重要でない部分の音程を一段下げる、あるいは平坦にする
強調と逆のことをする。つまり…
全体的に音程が一段下がる。
抑揚を弱める。下がるアクセントなら上げ、上がるアクセントなら下げ、音程の幅を狭める。
アクセントが逆転しないように注意。意味が変わったり訛ってるように聞こえては台無し。
グラフの音程と実際の音程は違うので、目だけで判断しないこと。
しゃべる速度を速め、さっさと流す。
空白があれば外す。
音程で気をつけるべき箇所
音程は喋りはじめで急激に上がり、その後ピークに向かってなめらかに上がり、ピークを超えると下がり始め、次の名刺の先頭で極地的に低くなりまた上がる。最終的には語尾で最も低くなる。まとめると
「しゃべりはじめ」は基本的に高い。
「/ ̄ ̄」の形の単語の「/」部分は局地的に低い。
「しゃべり終わり」は最も低い(感情を入れていない場合)。
そして、「強調すべき単語」は高い。
https://gyazo.com/5a9311855d2494a7aa0c086185bacc96
https://gyazo.com/e39e6cf97c6abfdf184fc4d791caa50b
この例だと…
「トーン」「イント―ネション」「調整します」の3つの要素のうち、伝えたい(重要な)のは「トーン」と「イントネーション」であり、「調整します」は重要ではない。なので「調整します」は他の要素より一段低い音程になっている。
「トーン」の「ト」は、「喋りはじめ」「強調すべき単語」「\__の形」という3つの要素が合わさった結果、文中で最も高い音程になっている。
「イントネーション」の「イ」、「調整」の「チョ」が極地的に低くなり、「ます」の「す」が最も低くなる。
「/ ̄ ̄」系の単語では「1文字目が最も低く、2~3文字目まで登り坂」が基本。登り坂にかける文字数が多くなるほどゆったりとした(リラックスした)語り口になる。「イントネーション」のような音数が多い単語は長くしても違和感はない。どちらにしろ、下がりはじめの音(この場合は「ネ」)までには上がり切ること。
上がり坂と比較して下り坂はなだらかに下げる。
感情は(特に)語尾に宿る
「ウソでしょ!」「ウソでしょ~」「ウソ…でしょ…!?」とテキストに書いてみてもわかるように、感情は主に語尾に宿る。テキストで上記のように書いたとしてもVoicepeakには伝わらないので、ユーザーが調整するしかない。
基本的に「!」とか「…」とかはVoicepeakには全く意味のない記号なので、すべて削除して「。」か「?」に置き換える。
ちなみに「?」自体に語尾をあげる効果はなく、「無声音が有声音になる」という効果のみ。
語尾を上げたい場合は「なんですかー」のように語尾を伸ばし、イントネーションで上げる(同時に長さを短くする)などして語尾上げをするなどの工夫が必要。
調整TIPS
セリフの途中で短い休みを入れたい場合
1.読点「、」を入れ、長さを調整する。
読点の長さは「ポーズの長さ」の影響を受ける。
2.カギカッコ(「か」)を入れ、長さを調整する。片方だけでも有効。
カギカッコは文の途中で短く休止を入れる効果がある。「ポーズの長さ」の影響をほとんど受けない。(ほんの少しだけ受けるっぽい)
3.短い休みの前後(話し終わりと、話し始め)は同じ声の高さになるように調整するとより自然。
イントネーションで下げてるのにどうしても上げて読まれる(逆もあり)場合
まずそもそもアクセントのほうでちゃんと上がってる/下がってることを確認する。
それでも言うことを聞かない場合は、ナレーター特有の問題の可能性あり。その場合…
問題の音に母音を足し2音にしてそれぞれ長さを最短(50%)にする。たとえば「か」であれば「か+あ」に分割し、それぞれ長さを50%にする。その後それぞれのイントネーションを再度調整してみる。この方法はどうしても違和感が出るので最終手段とすること。許されるならまず普通に出力したあとに他のソフトでピッチ補正のほうがマシかもしれない。