音声を文字列データにする - 電脳手帖

音声を文字列データにする

動画編集ソフトには、字幕のための抽出がよくあるイメージ

これをぱっと使えるようになりたい

英語でのこの行為は

、Speech to Text あたりか。

GoogleでなんかAPIあった気がするな

Googleドキュメントの音声入力がいいっぽい？

でもあれはマイク入力がいる

聞いてるものをマイク入力出来れば問題なし

オーディオインターフェースとかステレオミキサーの出番かな？？

てきとーなサイト見るとそれでの解説が結構あるからそうなんだろな

サーバーでの音声解析系をちゃんと機能として使うにはAWSとかAzureに登録しないとダメそうかなぁ

うーん。。

使えそうなサービス

MS

Speech Services

グーグル

Cloud Speech-to-Text