FunAudioLLM
https://gyazo.com/7fdc1242cfea868944d47accef0a3bc1
https://fun-audio-llm.github.io/Project
これは、人間と大規模言語モデル(LLM)との自然な音声対話を強化するために設計されています。フレームワークの中心には2つの革新的なモデルがあります。
1つ目は、SenseVoiceで、高精度な多言語音声認識、感情認識、音声イベント検出を行います。
2つ目は、CosyVoiceで、自然な音声生成を多言語対応、声質、感情のコントロールが可能です。
ComfyUI-FunAudioLLM