散布度
#テーマ2
散布度とは、データの散らばりぐあいを表したものである。
散布度を表すためには標準偏差を求めるのが一般的である。
月曜1限の統計学のスライドが分かりやすかったのでその画像を引用する。
https://gyazo.com/6760dd5b56777a43b7e0af7635c13fe3
画像の通り、(平均値-データの値)を2乗したものをデータの数だけ足し、それを(データの数ー1)で割ったものである。
また、分散の平方根を標準偏差という。
例として、データの平均値が5であった場合、他のデータが4,6などにまとまっていれば、平均値の2乗は1となるため、分散はそれほど大きくはならない。しかしながら、0や10といった値であれば平均値の2乗は25となるため、分散が大きくなる。また、外れ値があると分散の値はより大きくなり、それによってデータに誤解が生じる可能性もある。
参考文献、引用元
運営団体:東京都立大学 タイトル:統計学1(月曜一限、田中敬一 )日時:2020/6/1