老害が挑む!生成AIの導入!下書き
251203
17:43 - 目標設定
とりあえずよく聞く「びぐるAI」と「RVC」を使えるようになる!
使えるようになった判定はどうしよう
課題MADを設定しよう
課題MAD: 「折部やすな × テレキャスタービーボーイのサビ」
音声は人力オンリー、映像は原曲映像にやすなを被せるで済ませる
17:48 - びぐるAI……?について調べよう
Viggle AIというらしい
Viggle AIとは? - Gemini抜粋
静止画像からアニメーション動画を簡単に生成できるツール
Mix(ミックス):背景となる動画(モーション)と動かしたいキャラクターの静止画を合成し、背景動画の人物の動きをキャラクターに真似させる機能。
Multi(マルチ):複数人が映っている動画の動きを、複数のキャラクター画像に適用させてグループ動画を生成する機能。
Move(ムーブ):キャラクターの画像に対し、「歩く」「ジャンプする」といった基本的な動作をテキストで指示してアニメーション化する機能。
Animate(アニメート):既存のモーション動画を使わず、テキストプロンプト(指示文)に基づいてキャラクターをアニメーション化する機能。
17:55 - 早速Viggle AIを試してみよう
https://scrapbox.io/files/692ffbf331ded77df32c38d9.png
全身の静止画切り抜きが豊富なので、修造をチョイス
動きはテンプレートから
なんかYoutubeのダウンロードサイトに飛ばされるんですが
https://scrapbox.io/files/692ffcc6697228a1d00c12fb.png
こっちか!
18:03 - 生成中……一回休憩
18:12 - 生成を確認!
https://scrapbox.io/files/692fff06345990a8612138ef.png
やばすぎ
オモロ
多分だけど、長過ぎる動画は扱ってくれないから、小分けしたほうがいいね
18:13 - 次オリジナルの動きの動画
https://scrapbox.io/files/692fff79f7354c027bf406c7.png
さて……
https://scrapbox.io/files/692fffff0d1020276a7c9660.png
wwwwwwwwwwwwwwwwwwwwwwwwwww
Viggle AIはこんな感じかなぁ
18:18 - RVCについて調べよう!
AIのRVCとは? - Gemini
Retrieval-based Voice Conversion(検索ベース音声変換)の略で、AIを利用した非常にリアルで高品質な音声変換技術のことです。
RVCの大きな強みは、学習コストの低さです。
RVCはわずか数時間程度の学習時間で、高品質な変換モデルを作成できます
これは、技術の根幹に「検索ベース(Retrieval-based)」というアプローチを採用しているためです。
RVCのモデルは変換速度が速いため、ライブ配信やボイスチャット(VRChatなど)でのリアルタイムな声変換にも対応できます。
え!!!!!!!!リアルタイム音MAD
オープンソース
18:25 - 使うか……
うさぎでもわかるRVC - 少量データで実現する高品質音声変換技術
とりあえずD:\toolに場所を作った
エラー
今使ってるpythonのバージョンと互換性がないらしい
251204
21:23 - とりあえず対応しているPythonのバージョンの環境を作る
21:54 - 難航中
とりあえず、Ubuntuに新しく環境作ることに
UbuntuにPython環境導入251204
23:13 - とりあえず、この状態でRVCをインストールする
https://scrapbox.io/files/693198d659d96c2eee1ab8ec.png
怒るよ
企画倒れやん
23:26 - 結局、ライブラリインストールのバージョン指定を消して実行
https://scrapbox.io/files/69319ad9af37d4a585dcd2e8.png
手動でチマチマやったけど、ERROR: No matching distribution found for faissが
マジすか
今日は諦めます!
フォルダ整理に没頭