潜在意味解析
潜在意味解析:
Latent Semantic Analysis
,
LSA
潜在的意味索引または潜在意味インデックス:
Latent Semantic Indexing
,
LSI
各行が各単語、各列が各文書の疎行列
各成分の重み付けに
tf-idf
を使う
この行列を
特異値分解
する
k個の最大特異値を選べばk次元への最小誤差での
埋め込み
ができる
フロベニウス・ノルム
文書IDから単語tf-idfベクトルを得る関数を、隠れ層がk個・1層の
Autoencoder
的ネットワークで学習するのに相当する