音声認識 ASR
クラウドベンダー提供のAPIを使わない方法を調べた
ディープラーニングのモデルを使う方法
観点の1つ:
日本語に対応しているか
Project DeepSpeech
ESPnet
KALDI
QuartzNet(NVIDIA)
積ん読
https://www.ogis-ri.co.jp/otc/hiroba/technical/similar-document-search/part10.html
NVIDIA の QuartzNet を用いて、日本語音声の認識に挑戦します。
『
Pythonで学ぶ音声認識
』をまず当たってみる予定
学習済みモデルを探してESPnetを最初に触るとした
音声認識の事前学習モデル
AlexaもASR
https://developer.amazon.com/en-US/alexa/alexa-skills-kit/asr