相関係数
https://gyazo.com/20582ecad91de0108184c6329041ab59
相関係数とは
2つの確率変数の間にある線形な関係の強弱を測る指標である。相関係数は無次元量で、−1以上1以下の実数に値をとる。
つまり、散布図の分布を線形的に近似してⅡ見たとき、一次関数(y=xなど)においての傾きにあたる部分(xの係数)が相関係数になっている。
相関係数はよく「r」で表され、上の図のように計算される。
このとき、x(i),y(i)は各データの値であり、xおよびyのバーは平均を表す。
また、分子をxとyの共分散、分母の第1項のルートの中身をxの分散、第2項のルートの中身をyの分散という。(そのルートをとったものは標準偏差という)
分散
各値と平均との差(偏差)の2乗の平均。sの2乗として表す。
平均と各データの値の差を正方形の面積で表したようなイメージ
s^2 = Σ ( x(i) - x' )^2 (x' をxの平均とした)
共分散
x(横軸のデータの各値)とy(縦軸のデータの各値)の偏差の席の平均値
平均と各データの差を長方形の面積で表したイメージ
s(x,y) = Σ ( x(i) - x' )( y(i) - y' ) (x' をxの平均、y'をyの平均とした)
標準偏差
分散の平方根(元のデータと単位が一致する)
以上から相関係数rは
r = s(x,y) / s(x)*s(y)
として表せる。
また、相関係数が正のとき確率変数には正の相関が、負のとき確率変数には負の相関があるという。また相関係数が0のとき確率変数は無相関であるという。
参考文献;
相関係数-Wikipedia
以前のオンラインノート
参考:11/2
受験の月<学校では教えてくれない受験のための数学・物理・化学>
高校数学Ⅰデータの分析~共分散sxy、散布図と相関係数rxyの関係一覧~