word2vec
単語の間の関係性を定義できる
単語を意味的な特徴を持つ数値ベクトルとして表現する手法。 単語を固定長ベクトルに変換することで、言葉同士の類似度や関係性を計算することができるようになる。 そのため、すべての単語が同じ位置に射影され、単語ベクトルが平均化される。 入力に未来の単語4つと過去の単語4つを用いた対数線形分類器を構築することで、最高の性能が得られた。 学習基準は、現在の単語を正しく分類することである。
過去を前、現在を真ん中、未来を後と読み替えても良い。
$ Q=N\times D+D\times\log_2 V
$ N:過去の単語の個数
$ D:入力の次元数
$ V:語彙の大きさ
3.2 Continuous Skip-gram Model
CBOW が文脈に基づいて現在の単語を予測するのに対して、Continuous Skip-gram Model は同じ文中の別の単語に基づいて単語の分類を最大化しようとする。 各現在の単語を連続射影層を持つ対数線形分類器への入力として使用し、現在の単語の前後の一定範囲内の単語を予測する。 通常、遠い単語は近い単語よりも現在の単語との関連性が低いため、訓練例において遠い単語のサンプル数を減らすことで、遠い単語の重みを小さくする。 $ Q=C\times(D+D\times\log_2V)
$ C:単語間の距離の最大
$ D:入力の次元数
$ V:語彙の大きさ
作り方
学習時に入力される単語はトークン化されている事が想定されている。 多分これであってるはずSummer498.icon
感想Summer498.icon
ニューラルネットワークと呼ぶ際の本質的な部分である非線形性が削除されているため 多分出来上がったものを使う時のことしか考えておらず、学習過程がイメージから抜けてるんだと思うnishio.icon