word2vec
15分でできる日本語Word2Vec - Qiita
米googleの研究者が開発したWord2Vecで自然言語処理(独自データ) - Qiita
単語の類似度をだしたり、意味の計算ができる
Word2Vecを用いた類義語の抽出が上手く行ったので、分析をまとめてみた - Qiita
gensim
いれると簡単に使えるっぽい
派生系で
doc2vec
とか
item2vec
とかある
Python で「老人と海」を word2vec する · m0t0k1ch1st0ry
ちなみに、インターネット上にある word2vec を試してみました的なエントリのいくつかでは、text8 以外のコーパスを読み込むときにも word2vec.Text8Corpus を使っているみたいだけれど、word2vec.LineSentence を使って文ごとに読み込まないと、文と文の間で文脈がごちゃごちゃになってしまうような気がするので、今回は後者を採用する。
気になる。
text8コーパス
いますぐ使える単語埋め込みベクトルのリスト - Qiita
mecab
と
mecab-ipadic-NEologd
を使う
絵で理解するWord2vecの仕組み - Qiita
word2vec, fasttextの差と実践的な使い方 - にほんごのれんしゅう