音声AIアプリ
Speech 2 Speech
音声処理
音声認識
音声変換
音声合成
音声認識入門
音声基盤モデル
通話アプリを作るときの有用ライブラリ
Realtime APIとTwilioを用いた電話予約デモシステムの構築
https://www.ai-shift.co.jp/techblog/4980
How Voice AI will change the world
https://elevenlabs.io/blog/babbage-the-economist
VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction
https://arxiv.org/abs/2501.01957
AI Voice Agents: 2025 Update
https://a16z.com/ai-voice-agents-2025-update/
How do you optimize latency for Conversational AI?
https://elevenlabs.io/blog/how-do-you-optimize-latency-for-conversational-ai
FastRTCを使って爆速でVoicebotを構築する
https://www.ai-shift.co.jp/techblog/5680
音声チャット・音声エージェント プラットフォーム・フレームワークなどまとめ
https://zenn.dev/kun432/scraps/852b87d1a5f4ae