相関係数
相関係数とは
2 つの確率変数の間の相関(類似性の度合い)を示す統計学的指標
単位は無く、−1 から 1 の間の実数値をとる
1 に近いときは2 つの確率変数には正の相関があるといい、−1 に近ければ負の相関があるという 計算式
共分散:$ s_{xy}= \frac{1}{n} \sum^n_{i=1}(x_i- \overline{x})(y_i- \overline{y}) x,yの標準偏差: $ s_x= \sqrt{ \frac{1}{n} \sum^n_{i=1}(x_i- \overline{x})^2}$ s_y= \sqrt{ \frac{1}{n} \sum^n_{i=1}(y_i- \overline{y})^2} 相関係数:$ r = \frac{s_{xy}}{s_xs_y}
相関関係の傾向の強さ
$ 0.0 \leq |r| \leq 0.2:相関がない
$ 0.2 \leq|r| \leq 0.4:弱い相関がある
$ 0.4 \leq|r| \leq 0.7:相関がある
$ 0.7 \leq|r| \leq 0.9:強い相関がある
$ 0.9 \leq|r| \leq 1.0:完全な相関がある
https://gyazo.com/899046e1a245d9ef09765765bd5a61b8
エクセルでの式
=CORREL(xのデータ,yのデータ)
=PEARSON(xのデータ,yのデータ)
別名はピアソンの積率相関係数である。
現在、一番使われている相関係数であり、相関係数というとこれを示す。
参考文献
応用情報処理 散布図と相関係数・回帰分析