パープレキシティ指標
パープレキシティ(perplexity)は、言語モデルの性能を評価するための指標の1つ。
正しい単語を正しく予測していれば小さくなる指標。
モデルが実際のテキストデータをどの程度うまく予測できるかを測定する。
パープレキシティが低いほど、モデルの予測が正確であることを示す。
つまり、モデルが次に来るべき単語を高い確率で予測できているということ。
パープレキシティは、言語モデルの評価だけでなく、異なるモデル間の比較にも使用される。
パープレキシティが低いモデルは、一般的にテキストデータをよりよく理解し、生成することができると考えられている。