散布度(分布のばらつき)
①1つのデータ
1.分散
分散とは、平均からの偏差の二乗に基づく、データの散らばりの度合い(ばらつき)を表す値。分散の値が大きいほどそれぞれのデータが平均から離れている、つまり散らばりの度合いが大きいということを表す。
求め方
https://gyazo.com/9c9fa49f1a9188eacaa70919b695f1f9
画像引用元:https://atarimae.biz/archives/19027
2.標準偏差
標準偏差とは、分散の正の平方根に基づく、データの散らばりの度合い(ばらつき)を表す値。標準偏差の値が大きいほど散らばりの度合いが大きいということを表す。逆に、値が小さいほど散らばりの度合いが小さく、平均値の近くにデータが集中していることを表す。
求め方
https://gyazo.com/61bf79f158c8825c28d20f0959416ee3
画像引用元:https://atarimae.biz/archives/5379
分散と標準偏差の役割に大きな違いはない。しかし、分散はデータの値を二乗したものであるため単位が元のデータとは異なるものとなる。そのため分散よりも標準偏差を用いることが多い。
②2つのデータ
3.共分散
共分散とは、二つのデータの間の関係を表す値。値が正の場合、片方が増加すればもう片方も増加する。負の場合は、片方が増加すればもう片方は減少することを表す。
求め方
https://gyazo.com/22f1d96f56a513cc0f1ab751f553fb08
画像引用元:https://atarimae.biz/archives/15752
しかし共分散には単位の影響を受けるという欠点がある。そのため、二つのデータの関係を正確に理解するためには、後に述べる相関係数を使用するのが一般的である。
4.相関係数
相関係数とは、二つのデータの間の関係の強さを-1から1の間の値で表した値。1 に近ければ近いほど「強い正の相関がある」、−1 に近ければ近いほど「強い負の相関がある」、0 に近ければ近いほど「ほとんど相関がない」とされる。
相関の種類
正の相関・・片方の数字が増加すると、もう片方の数字も増加するという関係
負の相関・・片方の数字が増加すると、もう片方の数字は減少するという関係
無相関・・・片方の数字が増減しても、もう片方の数字の増減に影響がない関係
共分散とは異なり、単位の影響を受けない。
求め方
https://gyazo.com/03a93d67cd090f50538a9f8cd6c71e0e
画像引用元:https://atarimae.biz/archives/7966
積率相関係数
相関係数と役割や意味は変わらないが、1/nの部分が1/(n-1)となっている
求め方
https://weblio.hs.llnwd.net/e7/img/dict/tkgyg/TokeigakuNote/Soukan/r-eq1.png
画像引用元:https://www.weblio.jp/content/ピアソンの積率相関係数
③各データのExcelでの計算方法
分散・・・・VARP(数値1、数値2、…)
標準偏差・・STDEVP(数値1、数値2、…)
共分散・・・COVAR(配列1、配列2)
相関係数・・CORREL(配列1,配列2)
#テーマ2