コサイン類似度
https://gyazo.com/b78da4fdbb5d4335f17d0f2b131a9dc1
数学/統計学/機械学習におけるコサイン類似度(Cosine Similarity)とは、2つのベクトルが「どのくらい似ているか」という類似性を表す尺度で、具体的には(ベクトル空間における)2つのベクトルがなす角のコサイン値のことである。この値は、2つのベクトルの内積(=向きと大きさを持つベクトル同士の掛け算)を、2つのベクトルの大きさ(=L2ノルム)で割ることで計算される。
この計算によって値が-1~1の範囲に正規化されるので、コサイン類似度が、
1なら「0度で、同じ向きのベクトル=完全に似ている」
0なら「90度で、独立/直交した向きのベクトル=似ている/いない、のどちらにも無関係」
-1なら「180度で、反対向きのベクトル=完全に似ていない」
という意味になる(図1)。
鋭角ほど「似ている」
これを数値で表すのに、コサインの値が使えるらしい