（触りたい）学習済み日本語word2vec

Wikipedia日本語版をコーパスとして学習

ハイパーパラメタを変えた訓練

pip install 'gensim<4'

code:python

>> from gensim.models.word2vec import Word2Vec

>> model = Word2Vec.load("latest-ja-word2vec-gensim-model/word2vec.gensim.model")

>> model.vector_size

このモデルは日本語の単語を50次元のベクトルに変換できる

Parameters used for training this model are size=50, window=8, min_count=20 (GitHub)

gensim.models.word2vec.Word2Vec

Word2Vec.wv.most_similar

model.wv.most_similar(positive=["日本", "ソウル"], negative=["東京"]) で「韓国」がまず返った

その他の wv 属性を参照する方法：gensim models.keyedvectors