MAI-Voice-1
https://microsoft.ai/news/two-new-in-house-models/blog
https://copilot.microsoft.com/labs/audio-expressionDemo
MAI-Voice-1 は超高速音声生成モデルで、1 つの GPU で 1 分の音声を 1 秒未満で生成できるため、現在利用可能な最も効率的な音声システムの 1 つとなっています。
TTSというよりspeech生成モデル?
VibeVoiceと比べると音声の品質はかなり悪いnomadoor.icon
#Microsoft_AI