ボーカロイド、声、界隈
境界
*5 「ボカロ曲」は(おそらくほぼすべてが)合成音声を使った楽曲ですが、逆に合成音声を使った楽曲のすべてが常に「ボカロ曲」に括られるわけではないでしょう。例えば、初めてコンピューターが歌ったとされるIBM 7094による「Daisy Bell」(1961)はボカロ曲でしょうか? それはカバーであってオリジナル曲ではない? ではRadiohead「Fitter Happier」(1997)は?
自分は全てはっきりボカロだと言える
「合成音声」の読みとしてボカロを使っているに過ぎない
商標 "ボカロ"・"VOCALOID"
門脇さんがものすごい勢いでオルタナティブなボカロ曲を発見していくのを眺めている。「もうそこ!?」と思ってしまうが、そもそもルートが全然違うんだろうな
今って合成音声もVOCALOID一強ではないし、動画サイトもニコニコ動画が中心地とは言えなくなってる。その磁力が弱まった代わりにTikTok、音MAD、トラックメイカー的な価値観がなんとなくごっちゃになった時期に自分の目からは見えてる(ある意味では黎明期にあったと思われる異文化混交的な性質が戻ってきている?)。
自分はどうしてもニコニコ動画の上層部から下に潜っていくイメージで聴いてしまっているが、そんなのすっ飛ばしてSpotifyの関連アーティストから聴いていく方が今時なんだろうな。
この「磁力」って、ニコニコ動画に投稿してVOCALOIDタグを付けたら即ボカロ曲として扱われシーンに組み込まれるという「引き寄せる」力もそうだけど、逆にそれ以外を疎外する「突き放す」力もあると思うんですよね。それが弱まってるのかなとは思う。そんなことは全然なくて、単に自分の観測範囲が広くなっただけという説もかなり有力だけど……。
「ニコニコ動画に投稿してVOCALOIDタグを付けたら即ボカロ曲として扱われシーンに組み込まれる」というのはこういうことですね(極端すぎる例)
(ω)ちゃんのテーマ
VOCALOIDの脆弱性
https://youtube.com/watch?v=3FpWLE312Dk&feature=share
peanut phenomenonのイントロのボイス多分初音ミクな気がするのでボカロ曲です
ニコニコ動画へのボカロアルバムクロスフェード投稿懇願おじさん
https://pbs.twimg.com/media/FPug781VIAEeV8V.png
「合成音声だったらなんでもいい」
声の楽器
イメージボイス用途の可不可
UTAU音源の利用規約ではイメージボイスとしての利用を禁止しているものが少なくない
禁止事項
他の創作・版権・UTAUキャラクターへ声を当てる行為(所謂イメージボイス)
= 合成音声のキャラクター性の比重が大きい
逆にSynthesizerVのこういった立ち絵の無いボイスバンクはキャラクター性が希薄
https://gyazo.com/2eba5f9fbe27b8fd2e9ecf1e99534bf2
実際SynthVは仮歌用合成音声として一般化しつつある
一番の要因は単純に歌声のクオリティの高さだけど、こういった要素も無視できない気がする
花譜と可不
可不のデモ発表時、花譜に近い声のAタイプ、機械音感が強いCタイプ、その中間のBタイプのどれを搭載するかでアンケートが取られた
結果的に採用されたのはBタイプ
先ほど紹介した「可不」は製作が発表されたとき、そのあまりにも本人(Vtuberの花譜さん)に似た歌声に、ファンを中心に戸惑いの声が上がり、「可不」の歌声をどの程度本人に近づけるかのアンケートが行われました。
アンケートの結果、結局のところ一番本人に近いtypeAが最多得票となりましたが、最終的には、花譜さん本人の意向を踏まえて中間のTypeBで商品化はなされました。
https://scrapbox.io/files/64f814a415c4fd001c72927d.jpghttps://scrapbox.io/files/64f814a99cdf3d001ca6f79b.jpghttps://scrapbox.io/files/64f814ab097f62001c2ab6ef.JPEG
花譜の音楽的同位体「可不」について、今の私の気持ちをお話します。
https://gyazo.com/259bf025a8d30a764bded8467df0160dhttps://gyazo.com/77ccfe895a6aa85968bc718561c6c134
SynthVはAに近い?(発売までデモすらなかった)
↑が書き込まれたのは2024/1/13
可不 Synth V は発売延期
「音楽的同位体 可不(KAFU)
collaboration with Synthesizer V AI / The Right Stuff ver.」
発売延期についてのご報告になります。
https://gyazo.com/e8cf2fb90c2054d4770fa94f85eb7a0a
Synthesizer Vの可不ちゃんについて、発売をお待たせしていて申し訳ありません。
新しい可不ちゃんの開発が本格的に開始される前に、頂いたボイスサンプルを聴かせていただき、プロデューサーさん、運営さん達と一緒に、自分が納得が行くものを選びました。
しかしその後、実際にフォニイという曲として調整された可不ちゃんの声を聞いて、自分のなかに違和感が浮かんだものの、もう発売日も間近なので、発売延期はできないのではないかと私が勝手に思い込んでしまったため、フォニイの動画投稿に関して承諾しました。
その後動画に対していただいた沢山の反応を含め、私はこの新しい可不ちゃんを喜んで様々な人のもとに送り出すことは出来ないと改めて思ってしまいました。
運営さんにその旨をお伝えして、今年一月の予定だった発売を、無理を言って延期していただく運びとなりました。
>今後この件がどのような形になるのかはまだわかりませんが、引き続きチーム内で話し合いをしています。
二度とこのような事が起こらないよう、一つ一つ自分自身と向き合っていきます。
楽しみに待ってくれている皆さま、本当にごめんなさい。
ボーカルチョップ
実際に「声の楽器」として近いのはどちらかというとボーカルチョップとか?
楽器ならわざわざ人の言葉を載せたりせず出る音に集中するはず
「中の人」
初音ミクAIは藤田咲AI ?
そもそも、どうして安易にVOCALOID5で音源を作らずにNTを開発したのでしょう?
この答えに対する糸口を掴むには、マジカルミライでの初音ミクNT発表に遡ります。
そこで確か佐々木渉(wat)さんが「VOCALOID5は人間の声が混ざるので、それは初音ミクではなくて藤田咲だ」ようなことを言っていました。
これは多分VOCALOID5のアタック・リリースエフェクトで生声が混ざることを指してることを言ってますが、私はこれが半分本当で半分嘘だと思っています。
(ここからは多分に憶測が多分に入りますのでご注意ください。)
もともと、YAMAHAはVOCALOID5にてAI機能を追加しようとしたんだと思います。
この動画を見る限り既存のVOCALOID4などのプロモーションと違い、ものすごく「未来感」を感じます。そしてこれらの機能群や操作方法は、音源がAI化したときに真価を発揮するものばかりです。(特に1:04辺りの「I sing for you」の「you」がものすごく不自然)
ただ、そう主張するとVOCALOID5は2018年リリースで、美空ひばりVOCALOID:AIの発表はは2019年じゃないか、という風になると思います……が、実は2017年、ヤマハと共同で歌声合成技術の開発をしているボンペウ・ファブラ大学が、現在のいわゆる「AI歌声合成技術」の先駆けになる「ニューラルパラメトリック歌声合成」という論文を発表しています。
美空ひばりAIはこれがベースになって作られたと思われます。
ただ、ヤマハは3年ごとにVOCALOIDをアップデートしてきたこともあり、それに合わせて発表するには実用化への研究や実装が間に合わず、「AI抜きのVOCALOID5」という歪なモノがリリースされてしまったのだと思います。
これを踏まえてwatさんの発言をもう一度見てみましょう。
「VOCALOID5は人間の声が混ざるので、それは初音ミクではなくて藤田咲だ」
そう、これはVOCALOID5のことを話しているのではなく、AI歌声合成全般についての発言でもあるとも捉えられるのです。
初音ミクをAI化するなら「藤田咲に歌って貰えばいいではないか」という発想になるが、これは初音ミクAIではなくて「藤田咲AI」にしかならない、ということです。
だといって、VOCALOIDから出力された音声をAI化してもそれはVOCALOID版初音ミクの劣化版にしかならないのです。
無生物音源
UTAUボイスバンクの直wavを開いたときの「生の人間」が飛び出てくるグロさといったら!
(その点、足立レイはそのまんまでよい)