MAI-Voice-1

MAI-Voice-1 は超高速音声生成モデルで、1 つの GPU で 1 分の音声を 1 秒未満で生成できるため、現在利用可能な最も効率的な音声システムの 1 つとなっています。

TTSというよりspeech生成モデル？

VibeVoiceと比べると音声の品質はかなり悪いnomadoor.icon