相関係数
相関係数とは、
2種類のデータの(直線的な)関係性の強さを −1 から +1 の間の値で表した数のこと。
相関係数の求め方
xとyの2つの変数があったとき、xとyの共分散を$ s_{xy}、x,yの標準偏差をそれぞれ$ s_x,s_yとおくと、xとyの相関係数$ r=\frac{s_{xy}}{s_x \times x_y}と表すことができる。 相関係数の値
相関係数は-1~1の範囲の値をとる。1に近いほどデータは強い正の相関関係にあり、-1に近いほど強い負の相関関係にある。相関係数が0に近い場合データには無相関といえ、2つのデータの大小には直接的な関係がないことがわかる。 相関係数の注意点
少ないデータからの相関係数はあまり意味を成さない。
ある2つの変数からなる10個のデータをとってきて、そのデータの相関係数が0.8だったとする。このような場合たまたま正の相関が見られただけで、母集団に同じ相関が見られるかは定かでない。 外れ値に影響を受けやすい。
参考文献
アタリマエ!:相関係数とは何か。その求め方・公式・使い方と3つの注意点
(閲覧日 2020/12/4)