N-gram
とは?
N-gram言語モデル
直前の(N-1)個の単語を見て、次の単語を予測するモデル
グーグルで_____
の下線部に入る文字を予測する場合、
グーグル
と
で
の2 単語から次を予測しているので、
tri-gram
言語モデル
現時点の単語/文字が、直前の (N-1) 個のみに影響を受ける、という仮説
これはペンです
を
文字単位
の
N-gram
にした場合
uni-gram
N=1
こ
れ
は
ペ
ン
で
す
bi-gram
N=2
これ
れは
はペ
ンで
です
tri-gram
N=3
これは
れはペ
はペン
,
ペンで
ンです
https://japan.googleblog.com/2007/11/n-gram.html
https://blog.wackwack.net/entry/2016/03/21/221821