意味分布の可視化
nishio.icon日本語の埋め込みベクトルと英語の埋め込みベクトルを重ねて表示して、ある日本語の単語にはあまりよく対応する英単語がないことを可視化したい
gpt.icon日本語の埋め込みベクトルと英語の埋め込みベクトルを重ねて表示し、ある日本語の単語に対応する英単語がうまく見つからない状況を可視化するためには、まず日英の単語埋め込みベクトルを用意し、それらを同じ空間にマッピングする手法が必要です。一般的には、事前に訓練された単語埋め込みモデル(例:Word2Vec, GloVe, FastTextなど)を使用し、その後、線形変換を通じて二つの言語のベクトル空間を合わせるアプローチ(例:Orthogonal Procrustes問題を解く)が採用されます。
---
Orthogonal Procrustes問題、知らなかったけど適切
プロクラステス分析(procrustes analysis,プロクラステス解析とも)は点同士の対応がとれた2つの点群に対して,並進・回転・一様なスケーリングの変換のもとで,点群間の二乗誤差が最小になるように重ねあわせする処理です.この記事では特に,回転行列が直交行列であるようなケースの直交プロクラステス分析(Orthogonal Procrustes analysis)について扱います.
関連