word2vecをハッシュにするトンチキなアイデア
Summer498.icon
→ Attention モデルの発想はこれに似ている
でたらめすぎるnishio.icon
1: 連想配列に使うハッシュ関数は1つの整数値を返して、それを配列の添字に使う
word2vecの返す値は通常数百〜数千次元の実数値
2: 似たものが似た位置に写像されることがword2vecの特徴だが、連想配列に使うハッシュ関数は「なるべく散らばるように」使われるもの、方向性が真逆
3: word2vecの「単語からベクトル」という仕組みを考えた時、そもそも単語の側に整数値のインデックスが振られているのでword2vecをハッシュ関数にするよりもmod取る方が素直な実装
一般化して「文章からベクトル」とする場合、ほとんどの実装で「同じ入力なら同じハッシュ値が返る」という特徴を満たさないので連想配列に使いにくい
自分でトンチキなアイデアとつけておいたSummer498.icon