word2vec
単語
の
意味
は周辺の
単語
によって決まるという
分布仮説
という
言語学
の主張を
ニューラルネットワーク
で表現したもの.
ニューラルネットワーク
の
中間層
での値を
単語
の
意味
をしめすものとして考える.
"王様" - "男性" + "女性" = "女王" のような
ベクトル
の演算
2つの手法がある
スキップグラム
CBOW
周辺の
単語
から
単語
を予測する
モデル
主成分分析
を用いて
次元削減
にも用いられている
延長線上に
fastText
という
ライブラリ
がある
単語埋め込み
を
学習
する際に
部分文字列
の
情報
も含める違いがある.