TF-IDF
Term Frecency-Invercse Document Frequency
文章の単語ごとに計算されるTFとIDFを掛け合わせたもの.
TF: 文章内での単語の出現割合.
IDF: 単語が出現する文章の割合の逆数に対してさらに対数を取ったもの.
文章での単語の出現回数が多く,かつ他の文章ではあまり登場しない単語が大きな値となる.
その単語が重要であると考えることができる.