相関係数
相関係数
相関係数は2種類のデータを示す指標であり、-1から1までの範囲で値をとる。
rを相関係数とすると
-1≦r≦-0.7は強い負の相関、-0.7≦r≦-0.4は負の相関、-0.4≦r≦-0.2は弱い負の相関、-0.2≦r≦0.2はほとんど相関なし(無相関)
0.2≦r≦0>.4>は弱い正の相関、0.4≦r≦0.7は正の相関、0.7≦r≦1.0は強い正の相関と定義されている
正の相関は一方の値が増加するともう一方の値が増加する傾向にあるといえる状態である (r>0)
負の相関は一方の値が増加するともう一方の値が減少する傾向にあるといえる状態である (r<0)
https://gyazo.com/1a5e9cc6d74ea50f86c204403809367f
相関係数の求め方はn個のデータが2種類あるとすると、それぞれのデータの偏差の積の平均をとる。これを共分散という。そして、この共分散を2種類のデータのそれぞれの標準偏差の積で割ると相関係数を求めることができる。
EXCELでの計算方法・関数
関数を使う方法としては関数CORRELを用いることによって求めることができる。これはデータ全体で一つの値としての相関係数を求める。
分析ツールを使う方法は一度に何組ものデータセットについて相関係数を求めることができる。例えば、北半球の各地点の月ごとのデータがあるとすると、月を比較しての相関係数が求められる。
https://gyazo.com/e6c363a38c3bf489b97e4d6f0c810d92
相関係数の表
https://gyazo.com/5a6fc1c1577fbbc91c42b227117b26aa
積率相関係数→いわゆる一般的な相関係数
正規分布に従う2つの変数間の直線的な関係の強さを知りたい時に使用します。データは必ず正規分布に従うものでなくてはならない。データが正規分布に従わない場合はSpearmanの順位相関係数もしくはKendallの順位相関係数を使う必要がある。方式を混同して用いてはならない。
順位相関係数
ケンドール:2種類のデータの中でn個のペアがあり、そのペアの組み合わせで差の積を求め、それが正ならば順方向、それが負ならば逆方向として全部のペアを確かめて、(順方向のペア数ー逆方向のペア数)/nC₂で求めることができる。ペアの値どうしに正の相関を持つペアが多ければ、順方向のペアが多くなる。逆に、負の相関を持つペアが多ければ、逆方向のペアが多くなる。
積率相関係数と異なり、これは大小関係のみを考慮している
スピアマン:与えられたデータが正規分布でない場合に用いられる。計算方法は2種類の比較対象それぞれn個のデータがあるなかで各変数に順位をつけて対応するもので差をとる。その差の二乗の和をDとすると
スピアマン相関係数=1ー6D/(n³ーn) となる。
相関行列:各データごとに基準や組み合わせを変えて求めた相関係数を表などに並べたもの
ヒートマップが表現方法として用いられることもある。
参考サイト:相関係数と意味と求め方 令和元年11月9日閲覧
エクセルによる相関係数の求め方 令和元年11月9日閲覧
Pearsonの積率相関係数 令和元年11月9日閲覧
ケンドールの順位相関係数 令和元年11月9日閲覧
ピアソンの相関係数、Spearman(スピアマン)の順位相関係数 令和元年11月9日