n-gram
「n-gram」とは連続するn個の単語や文字のまとまりを表す。
例えば以下の文がデータとして与えられたとします。
太郎 は りんご を 買 った
ここでスペースは単語の区切りを表します。
この文章が与えられた時のn-gramを考えてみましょう。
n=3、すなわち3-gramは連続する3個の単語のまとまりなので、この文の中には以下の4つの3-gramが含まれることになります。
太郎 は りんご
は りんご を
りんご を 買
を 買 った
同様にして、n=2の時は以下の5つの2-gramが含まれています。
太郎 は
は りんご
りんご を
を 買
買 った
すなわち、T個の単語からなる文においてT-n+1個のn-gramが含まれていることになる
n-gramリコールとは?
リコール(Recall): 「リコール」とは、特定のタスクでモデルが正しく検出または再現したアイテムの割合を指す。これは、全ての正解アイテムのうち、どれだけのアイテムをモデルが見つけ出したかを示す。
n-gramリコールの意味: この指標では、特定の参照テキスト(正解テキスト)に含まれるn-gramのうち、モデルが生成したテキストがどれだけ再現できたかを測定する。
高いn-gramリコールスコアは、モデルが参照テキストのn-gramを多く含むテキストを生成したことを意味し、そのテキストの品質が高いとされる。
n-gramリコールは、特に機械翻訳やテキスト要約、自動キャプション生成などのタスクにおいて重要な評価指標となる。この指標は、生成されたテキストがどれだけ元のテキストの意味や内容を正確に反映しているかを評価するために使用される。
使われている評価指標
要約生成等のモデルの評価に広く利用される評価指標で,正解要約中のN-gramのうち,どの程度が生成要約に含まれているかで評価する
BLEUは機械翻訳等のモデルの評価に広く利用される評価指標で生成したテキスト中のN-gramのうち,どの程度が正解テキストに含まれているかで評価する
ROUGEがRecallベースの評価指標であったのに比べて,BLEUは適合率ベースの評価指標になる.