FunAudioLLM
https://gyazo.com/7fdc1242cfea868944d47accef0a3bc1
https://fun-audio-llm.github.io/
Project
これは、人間と大規模言語モデル(
LLM
)との自然な音声対話を強化するために設計されています。フレームワークの中心には2つの革新的なモデルがあります。
1つ目は、
SenseVoice
で、高精度な
多言語音声認識
、
感情認識
、
音声イベント検出
を行います。
2つ目は、
CosyVoice
で、自然な
音声生成
を多言語対応、声質、感情のコントロールが可能です。
ComfyUI-FunAudioLLM