word2vecをハッシュにするトンチキなアイデア
from word2vec
Summer498.icon
単語を固定長ベクトルに変換するってことは、ハッシュの定義も満たすんじゃねSummer498.icon
ということは、word2vec を連想配列のハッシュとして用いると、
意味空間構造が埋め込まれたベクトル空間上の数ベクトルを用いることができる。
→ Attention モデルの発想はこれに似ている
word2vec を連想配列のハッシュとして用いると
でたらめすぎるnishio.icon
1: 連想配列に使うハッシュ関数は1つの整数値を返して、それを配列の添字に使う
word2vecの返す値は通常数百〜数千次元の実数値
2: 似たものが似た位置に写像されることがword2vecの特徴だが、連想配列に使うハッシュ関数は「なるべく散らばるように」使われるもの、方向性が真逆
3: word2vecの「単語からベクトル」という仕組みを考えた時、そもそも単語の側に整数値のインデックスが振られているのでword2vecをハッシュ関数にするよりもmod取る方が素直な実装
一般化して「文章からベクトル」とする場合、ほとんどの実装で「同じ入力なら同じハッシュ値が返る」という特徴を満たさないので連想配列に使いにくい
自分でトンチキなアイデアとつけておいたSummer498.icon