散布度・代表値
最大値・最小値・範囲 外れ値 エクセル関数名
最大値:データの中で最も度数の大きい値 MAX
最小値:データの中で最も度数の小さい値 MIN
範囲:最大値ー最小値をしたもの
外れ値:ほかのデータから見て極端に大きい値や小さい値
→外れ値の判定法:スミルノフ・グラブス検定をつかう方法
四分位範囲(IQR)を利用した方法
分散・標準偏差
偏差:各値と平均値との差
分散:偏差の二乗の和の平均 VAR VARP
標準偏差:分散の平方根 STDEV.P STDEV.S
偏差値:平均値が50、標準偏差が10になるよう標本変数を規格化したもの→得点分布が異なるテストの成績を比較可能
式:偏差値=10*偏差/標準偏差+50
平均偏差:データの偏差の絶対値をとり、それらを平均した値 AVEDEV
これらの値は散布度を知るうえで役に立つが、外れ値に影響されやすい
参考サイト:受験の月 分散s²と標準偏差s、分散の別公式
代表値・・・データの分布をひとつの値で表すことができる値
平均値:各値の和を個体数で割ったもの→外れ値に影響される AVERAGE
中央値:データを大きさの順番に並べたときに中央に来る値 MEDIAN
最頻値:頻度が最大となるデータの値→階級に分けて使われることもある MODE