音声基盤モデル
音声工学・音響工学
音声処理
音声認識
音声変換
音声合成
音声認識入門
Speech 2 Speech
text2speech speech2text
基盤モデル
LLMと音声基盤モデルを用いた音声認識
https://speakerdeck.com/spiralai/llmtoyin-sheng-ji-pan-moderuwoyong-itayin-sheng-ren-shi
Amphion: An Open-Source Audio, Music, and Speech Generation Toolkit
https://github.com/open-mmlab/Amphion
Pushing the frontiers of audio generation
https://deepmind.google/discover/blog/pushing-the-frontiers-of-audio-generation/