【日本語モデル付き】2020年に自然言語処理をする人にお勧めしたい文ベクトルモデル
SentenceBERTの紹介
この日本語モデルを使うことで、誰でも簡単に高品質な文ベクトルを作れるようになります。
BERTの原論文にも書かれているとおり、これらを文ベクトルとして使うことは適切ではありません。
これら=素のBERTのCLSベクトルやBERTの埋め込みの平均
一方、Universal Sentence Encoderのような既存の深層ニューラルネットワークを用いた文ベクトルモデルの学習は計算コストが高すぎて、自分で学習させるのは辛かったりも。