N-gram
とは?
N-gram言語モデル
直前の(N-1)個の単語を見て、次の単語を予測するモデル
グーグルで_____ の下線部に入る文字を予測する場合、グーグル と で の2 単語から次を予測しているので、tri-gram 言語モデル
現時点の単語/文字が、直前の (N-1) 個のみに影響を受ける、という仮説
これはペンです を 文字単位 の N-gram にした場合
uni-gram N=1
こ れ は ペ ン で す
bi-gram N=2
これ れは はペ ンで です
tri-gram N=3
これは れはペ はペン, ペンで ンです
https://japan.googleblog.com/2007/11/n-gram.html
https://blog.wackwack.net/entry/2016/03/21/221821