ピッチシフトマグロナシステム(2020年8月)
注意:タイトルは筆者が勝手につけた。こういう単語は放送中には出ていません
https://youtu.be/tSeD1t5iz-c
130%超えで品質劣化するが、男声→女声変換は130%では足りない
パラメータをテストして一瞬の可愛さがでるかを確認する
このデバフを話し方・声の出し方で減らすことになる
お勧めIF
[Babyface Pro FS - Synthax Japan Inc. シンタックスジャパン]の無印 中古 レイテンシは100-120msまではギリ歌える
ルーティング
長時間使うと遅くなる
仮想ルーターをつかう必要がない
HWにどの音を入出力するかが選べる
1:22:00 ここからガチ勢向け
周波数ごと(20分割ぐらい?)に切り分けて変換してmix
音程によってパラメタのスイートスポットが違う
普通の声で良くても低い声にすると全然かわいくない、みたいになる
全体て平均値を出すセッティング
欠点
音が濁る。
同じトラックを重ねている。リミッターをかけているので、ちょっとしたため息とかでコンプがかかる
基素.iconここ理解できてない
2019年 MTransformerでのモジュレーションで、高い声/低い声ごとにスペクトルエンベロープが設定できるので頑張っていたが、人間のやる作業ではなかった 基素.icon ここら辺FANBOXにも書いてた
現環境:可変ピッチで声のレンジを女性にする
変換前の音のクリアさの向上(これは必要が出たらやればいい)
オーディオIFをUA55→Babyface Pro
上(8000kHz↑)の倍音がボイチェンでは重要
生声では気にならないが、ボイチェンをかけると影響が出る
16kHzより上は削ってもいいと言うのがボーカルの常識だが、実際に消してみると消すと声の抜け間がなくなってしまう
高周波の音のパワーは弱いし、ピッチシフトをするとノイズになる(EQで削ってるのと同じ)
2:07:00 男性と女性で喉がゴロゴロする領域が違うと言う考察
男性の方がゴロゴロ領域がでかい
上に合わせると
ピッチシフトしたときに、低い声が低くならない
中間も違和感のある声になる
下に合わせると
高い声が上がりきらない
基素.icon
ここ配信中の図を見た方がいい
ゴロゴロを出すなというのはここでも言われている(ここでは「エッジ」と表現されている)
アイデアの要点:元音声の検出ピッチごとにシフトする量を変える
動画2:18:00ごろ
低い声なら+5、高い声なら+7.5みたいにする
ステップ的に遷移するようにする
Mtransformがしゃりしゃりするので
プラグインの組み合わせで面倒なので、はじめはMtransformで探索した方が良い
BlueなんとかPich Analyzerにピッチに対してMIDI CCの数値を出力する機能があった
ただしこの値は線形
MIDI curveと言うプラグインに通す
MIDI ccの値をグラフに応じて上昇幅を変更する
このエンベロープの設定は気合で見つける
DAWのside chain(他のプラグインのパラメータを参照してプラグインのパラメータを動かす)をつかう
ボイチェン特性の考察
音域(女性の方が広い)
周波数帯域におけるゴロゴロ音の広さ(女性の方が狭い)
ボイトレで地声の高音域を伸ばすことでいけるのでは? Reafirのノイズ検出はレイテンシが大きい
iZotope RX7の方が上位互換 10-20msぐらい?
全体構成
iZotope ゲート・コンプ・リミッター
RX7 ノイズとる
可変ピッチでもループバックで聞いているので歌は歌える