埋め込みベクトルの拡張
ラベルが200次元空間に埋め込まれているとする
この情報を有効に活用する方法はあるか?
---
200次元の分散表現に、なんか別の方法で作った200次元の分散表現をマージする場合、400次元にしてからPCAで200次元に落としたらいいと思うけどKJ法などで人間が手で入れたものを追加する場合はどうしたものかなー、その軸は書き換わって欲しくないんだよなぁ、と思っている KJ法で入れる場合、そもそもすべての行に手でつけたデータがあるわけではないので別種の問題か〜という気もする
人間が全部のラベルの位置を入力するわけじゃないことを考えると「200次元の埋め込みベクトルと、人間が入力した少数の2次元ベクトルから、人間が2次元ベクトルを入力しなかったものについて2次元ベクトルを推測する」っている欠損値処理か 「200次元の埋め込みベクトルと、人間が入力した少数の2次元ベクトルから、人間が2次元ベクトルを入力しなかったものについて2次元ベクトルを推測する」っている欠損値処理が線形回帰で誤差なく推測できている時、その追加の2次元は残りの次元に線形従属なわけだからPCAかけたら誤差なく削減される