相関係数
https://gyazo.com/fa5e60b98b5a28e9cc5a4a6e18ac90eb
相関係数とは
「相関」というのは、2つ以上のもとがあるときに、それらが「どれぐらい類似しているか」という「類似度」を意味します。そして、相関係数とは、「類似度」の強さを「−1から1」までの範囲を取る数字として表現したものです。(2)
線形の関係の「類似度」を表すことができる
相関係数の計算方法
https://gyazo.com/49263111bf4274ed3a625314ab09de10
注意点
外れ値があると正しい相関係数が表せないため外れ値の有無を確認する必要がある
データに含まれる外れ値が相関係数の値に影響を及ぼしている場合があります。そのため、相関係数を求めるときにはまず散布図を作り、外れ値がないか等データの特徴を確認するようにしましょう。(1)
元データの単位の変更や2つのデータを一律での加減、乗除は相関係数に影響を与えないが、片方のデータのみ加工すると相関係数が変わってしまう場合がある(1)
線形ではない関係のデータでは相関係数は意味がなくなってしまう
相関係数は2つのデータによる直線的な相関関係の強さを表すものであり、線形ではない場合には相関関係の強弱は正しく表すことができません。したがって、いきなり相関係数を計算するのではなく、まずはデータをプロットした散布図を確認するようにしましょう(1)
excelでの計算方法
→ 相関係数 excel計算
参考
(1) 統計WEB 「7-2. データの相関を見てみよう」 (最終閲覧日:11月28日)
https://bellcurve.jp/statistics/course/20089.html
(2) Data Science by R and Python 『「相関係数」ってなんですか? -意味と利点と欠点をわかりやすく』 (最終閲覧日:11月28日)
http://tomoshige-n.hatenablog.com/entry/2014/08/06/035001
#テーマ3