AI音声処理
TTS
ボイスチェンジャー
音声認識 ASR:Automatic Speech Recognition
スタンドアロン、TTS
VOICEVOX互換
Web、TTSとか
GPU8GB(量子化) 16GB以上推奨
簡単、即学習
この辺までボイスモデル色々あるやつな
https://www.youtube.com/watch?v=aTUSzgDl1iY
あ、ボイチェン
Collabで学習させてみる
Seed-VC
OpenVoice
CosyVoice
VCClient
RVC
よくわかんねえんだけどVITSとかいうのに基づいた奴はモデル使い回せるのか?
AivisSpeechはStyle-Bert-VITS2がベースなのでStyle-Bert-VITS2モデルが使えるらしい
Sensevoiceは、自動音声認識(ASR)、音声言語識別(LID)、音声感情認識(SER)、オーディオイベント検出(AED)など、複数の音声理解機能を備えた音声基盤モデルです。
書き起こし 自動音声認識(ASR)
ウィスパー
動画の音声付ける奴
Sketch2Sound
Video to Audio
メモ
ゆかりねっとコネクターneo