音響モデル
ある単語列に対して音素列がどれくらいの確率で観測されるかを表す確率モデル.
隠れマルコフモデルが標準的に利用されている
RNNで実装される場合,音声データの時系列データの数と正しい音素の数が必ずしも一致しない.
Connectionist Temporal Classificationを用いている