Introducing next-generation audio models in the API

Speech-to-text

gpt-4o-transcribe

gpt-4o-mini-transcribe

OpenAI Whisperを超えたclosedモデル

text-to-speech

gpt-4o-mini-tts

IMO：SesamiやMoshiと比べてどうなんだろう？

VoicePipeline（TODO：積ん読）

https://www.youtube.com/live/lXb0L16ISAc?si=GD3l6tAQU-opJOEJ