音声基盤モデル
LLMと音声基盤モデルを用いた音声認識
Amphion: An Open-Source Audio, Music, and Speech Generation Toolkit
Pushing the frontiers of audio generation
#13: 最近のTTSについて語る 〜APIサービスから音声モデル作成まで〜 sense voice
Foundational Speech Technology:Enterprise-grade APIs for Speech-to-Text and Voice AI Agents