逆文書頻度
あらゆる文書を横断的に見たとき,その単語の頻度の逆数を,その単語の
重要度
とする
逆に言えば,あらゆる単語を横断的に見て,普遍的に現れる単語は
重要度が低い
と考える
Inverse Document Freqency
#自然言語処理