文字ベース言語モデル
文字ベースで
言語モデル
を作っておくといろいろ便利
作るのめんどくさいので誰か作ったモデルを公開してたりしないかな…
文字ベース言語モデルの作り方 - Ahogrammer
Wikipediaコーパス
ja.text8
を使う
50次元の埋め込みをしてから75次元の
LSTM
Elmoなどに使う
文脈を考慮した単語表現を獲得するELMo - Technical Hedgehog