相関係数
相関係数とは
2 つの確率変数の間の相関(類似性の度合い)を示す統計学的指標
単位は無く、−1 から 1 の間の実数値をとる
1 に近いときは2 つの確率変数には正の相関があるといい、−1 に近ければ負の相関があるという
計算式
共分散:$ s_{xy}= \frac{1}{n} \sum^n_{i=1}(x_i- \overline{x})(y_i- \overline{y})
x,yの標準偏差: $ s_x= \sqrt{ \frac{1}{n} \sum^n_{i=1}(x_i- \overline{x})^2}$ s_y= \sqrt{ \frac{1}{n} \sum^n_{i=1}(y_i- \overline{y})^2}
相関係数:$ r = \frac{s_{xy}}{s_xs_y}
相関関係の傾向の強さ
$ 0.0 \leq |r| \leq 0.2:相関がない
$ 0.2 \leq|r| \leq 0.4:弱い相関がある
$ 0.4 \leq|r| \leq 0.7:相関がある
$ 0.7 \leq|r| \leq 0.9:強い相関がある
$ 0.9 \leq|r| \leq 1.0:完全な相関がある
https://gyazo.com/899046e1a245d9ef09765765bd5a61b8
エクセルでの式
=CORREL(xのデータ,yのデータ)
=PEARSON(xのデータ,yのデータ)
積率相関係数とは
別名はピアソンの積率相関係数である。
現在、一番使われている相関係数であり、相関係数というとこれを示す。
参考文献
Data Science by R and Python 「相関係数」ってなんですか?意味と利点と欠点をわかりやすく http://tomoshige-n.hatenablog.com/entry/2014/08/06/035001
応用情報処理 散布図と相関係数・回帰分析
https://www.cuc.ac.jp/~nagaoka/2011/ouyou/10/expr/index.html
統計Web ピアソンの積率相関係数 https://bellcurve.jp/statistics/glossary/1233.html
#テーマ3