VOICEPEAK調教メモ
人間が話す時は必ず「伝えたいこと」があるはずである。伝えたいことがある限り、セリフのうちどの部分を伝えたいか=重要か、あるいは重要でないかの差が出来るはずである。重要な単語、言葉は【強調】すれば「もっと【伝わる】」はずである。
VOICEPEAKはAIといっても、テキストの「意味」を読み取っているわけではないため、セリフのどの部分がどれだけ重要か、それがどういう効果を持つかを理解しているわけではない。
なので人間(ユーザー)がやるべきことは「文脈を理解して、どの部分を【強調】していくか」である
強調すべき箇所の例
例文「コンビニでおにぎりを買いました。」
「どこで」買ったかが重要なら「コンビニ」を強調する。
「『コンビニ』でおにぎりを買ったんだけど、そのコンビニでさ…」
ただしこの場合は「おにぎりを買いにコンビニに行ったんだけど…」のほうが自然。
「何を」買ったかが重要なら「おにぎり」を強調する。
「コンビニで『おにぎり』を買ったんだけど、そのおにぎりがさ…」
例外として「強調する機能を持つ単語」は、強調される名刺ではなくその単語を強調すべき場合がある。
とっても大きく育ちました。→文脈としては「大きく」が重要だが、「とっても」のほうを強調する。
誠に遺憾である。
このジュースマジで美味いから。
カドに足をぶつけてクッソ痛い。
強調の方法
重要な単語を強調する
重要な単語の音程を一段上げてみる
重要な単語の抑揚をより強くつけてみる
重要な単語の頭の音の長さを長くしてみる
重要な単語の頭の前に空白(句読点、無音区間)を入れてみる
重要でない部分の音程を一段下げる、あるいは平坦にする
重要な単語の音声を一段上げてみる
重要な単語は重要でない単語より一段音程を高くする。
重要な単語の抑揚をより強くつけてみる
抑揚をつける。上げるアクセントならより上げ、下げるアクセントならより下げる。つまり、音程の上下の幅を広げる。
VOICEROIDには抑揚というパラメータがあってそれなりに便利だったが、VOICEPEAKには無い。個人的にはイントネーションと抑揚という、内部的には同じ効果を持つ(どちらもピッチをいじっている)パラメータが2つあるよりは、ひとつに統一されているボイスピのほうが使いやすいと感じている。(でもピッチを一律で変化させる抑揚のような「機能」があればそれはそれで便利かもとは思っている)
重要な単語の頭の長さを長くしてみる
単語の頭を伸ばすとリズムが崩れ、聞き手がそこが気になる。単語の頭を伸ばすことで聞き手の「気を引く」のである。
例「おおきな木」→「お~おきな木」
逆に単語の終わりを伸ばしても強調という意味ではあまり効果がない。単語終わりを極端に伸ばすことは強調よりもむしろ感情を入れる手段として有効(後述)
重要な単語の頭の前に空白を入れてみる
単語の頭に空白があると強調される。例えば読点「、」など。
長文を休みなく一気に読まれると聞き手は「息苦しく」感じる。それはセリフに呼吸が感じられないからだ。
実際に呼吸音が発せられるかは別として、空白は擬似的に「呼吸」を再現できる。息を吸ったあとは強い発声が出来るため、音程にも強さが現れる。
また「タメ」の効果もあるため、聞き手は次の単語に自然に注目するようになる。音楽のブレイクと同じ。
例「まさか『疑って』いるのか?」→「まさか<短い空白>疑って<短い空白>いるのか?」
カギカッコ「」でくくるだけでも短い空白が入るので覚えておこう。空白の長さも調整できる。
重要でない部分の音程を一段下げる、あるいは平坦にする
強調と逆のことをする。
音程を全体的に一段下げる。
抑揚を弱める。下がるアクセントなら上げ、上がるアクセントなら下げ、音程の幅を狭める。
アクセントが逆転しないように注意。意味が変わったり訛ってるように聞こえては台無し。
グラフの音程と実際の音程は違うので、目だけで判断しないこと。
しゃべる速度を速め、さっさと流す。
空白があれば外す。あるいは短くする。
音程で気をつけるべき箇所
音程は喋りはじめで急激に上がり、その後ピークに向かってなめらかに上がり、ピークを超えると下がり始め、次の名刺の先頭で極地的に低くなりまた上がる。最終的には語尾で最も低くなる。まとめると
「しゃべりはじめ」は基本的に高い。
「/ ̄ ̄」の形の単語の「/」部分は局地的に低い。
「しゃべり終わり」は最も低い(感情を入れていない場合)。
そして「強調すべき単語」は高い。
長さの調整
ナレーションではなく話し言葉として自然にしたい場合、流れるようなリズム(フロウ?)で発音させることがポイントである。
VOICEPEAKはすべての文字をできるだけ一様に喋るように作られているため、会話文の意味を理解して発話のリズムを作るのは人間(ユーザー)の仕事である。
基本的な読み上げの速さは「速さ」パラメータで調整し、適宜要所要所で長さパラメータを短く(たまに長く)していくほうが良い。
短くするポイントは以下のような文字である。
助詞。「を」「に」「の」「は」「が」等。ただし読点前や文末など、発声が切れる直前は除く。
基本的に助詞は文の中で最も重要でない箇所だからである。逆に助詞が重要になる場合は強調することもある。例「俺が、やったんだ」
「ん」。「こんにちは」のような「ん」は短くしたほうが自然。この場合「こん」のように直前の音とくっついてひとつの塊になり、長さを調整することで発音にリズムが生まれる。バランスを取るために「こ」を長くする場合もある。
「っ(小さいツ)」。「っ」は感情を入れやすいポイントなので強調のために長く取る場合もあるが、感情を入れたり強調する意図がないのであれば、基本的に「っ」は短くしたほうが良い。これも「っ」の直前の音を長めにしてバランスを取ることがある。
「サ行」。特に無声音のサ行はs音が聞こえれば十分なので、短くしたほうがリズムが良くなることが多い。「◯◯なんですよ」という文なら「◯◯なnでsよ」くらいの感覚で調整する。これも、文末などは除く(「◯◯です。」の「す」は短くしない)。
「つ(おおきいツ)」これも無声子音の「t」だけで十分な音である。
その他、流れによっては母音「あ~お」も比較的調整候補になりやすい。
感情を大きく出したい場合は、喋り始めの最初の文字を長めにすると感情が出る。やりすぎ注意。
また、ナレーターによって「あ」列が長めとか「え」列が長めといったような母音に特性がある場合がある。一律に数%短くしてやるのもあり。
まとめるとこんな感じ。「どうしてこんなことをしたんだ」→「どうsてこnなことwsたnだ」
感情は(特に)語尾に宿る
「ウソでしょ!」「ウソでしょ~」「ウソ…でしょ…!?」とテキストに書いてみてもわかるように、感情は主に語尾に宿る。テキストで上記のように書いたとしてもVoicepeakには伝わらないので、ユーザーが調整するしかない。
基本的に「!」とか「…」とかはVoicepeakには全く意味のない記号なので、すべて削除して「。」か「?」に置き換える。
ちなみに「?」自体に語尾をあげる効果はなく、「無声音が有声音になる」という効果のみ。
語尾を上げたい場合は「なんですかあ」のように母音で語尾を伸ばし(なんですかーのように長音にしてしまうと高さ調整が出来ないのでNG)、イントネーションで上げる(同時に長さを短くする)などして語尾上げをするなどの工夫が必要。
調整TIPS
セリフの途中で短い休みを入れたい場合
1.読点「、」を入れ、長さを調整する。
読点の長さは「ポーズの長さ」の影響を受ける。
2.カギカッコ(「か」)を入れ、長さを調整する。片方だけでも有効。
カギカッコは文の途中で短く休止を入れる効果がある。「ポーズの長さ」の影響をほとんど受けない。(ほんの少しだけ受けるっぽい)
3.短い休みの前後(話し終わりと、話し始め)は同じ声の高さになるように調整するとより自然。
イントネーションで下げてるのにどうしても上げて読まれる(逆もあり)場合
まずそもそもアクセントのほうでちゃんと上がってる/下がってることを確認する。
それでも言うことを聞かない場合は、ナレーター特有の問題の可能性あり。その場合…
問題の音に母音を足し2音にしてそれぞれ長さを最短(50%)にする。たとえば「か」であれば「か+あ」(「か+ー」だと高さ編集ができないので駄目)に分割し、それぞれ長さを50%にする。その後それぞれのイントネーションを再度調整してみる。この方法はどうしても違和感が出るので最終手段とすること。許されるならまず普通に出力したあとに他のソフトでピッチ補正のほうがマシかもしれない。