FunAudioLLM - work4ai

FunAudioLLM

https://gyazo.com/7fdc1242cfea868944d47accef0a3bc1

https://fun-audio-llm.github.io/Project

これは、人間と大規模言語モデル（LLM）との自然な音声対話を強化するために設計されています。フレームワークの中心には2つの革新的なモデルがあります。

1つ目は、SenseVoiceで、高精度な多言語音声認識、感情認識、音声イベント検出を行います。

2つ目は、CosyVoiceで、自然な音声生成を多言語対応、声質、感情のコントロールが可能です。

ComfyUI-FunAudioLLM