音声を文字列データにする
動画編集ソフトには、字幕のための抽出がよくあるイメージ
これをぱっと使えるようになりたい
英語でのこの行為は
、Speech to Text あたりか。
GoogleでなんかAPIあった気がするな
Googleドキュメントの音声入力がいいっぽい?
でもあれはマイク入力がいる
聞いてるものをマイク入力出来れば問題なし
てきとーなサイト見るとそれでの解説が結構あるからそうなんだろな
サーバーでの音声解析系をちゃんと機能として使うにはAWSとかAzureに登録しないとダメそうかなぁ うーん。。
使えそうなサービス
MS
グーグル