散布度
データのばらつきを表す値。分布の広がり方の特徴を示す
平均からの偏差の2乗の平均。
長所:要因による分解が容易で理論展開に優れている(数式上で扱いやすく、式変形がしやすい)
短所:分散の単位はもとの変数の単位の2乗になっているので解釈が難しい
無限母集団(無限に繰り返してデータを得ることができる実験等の母集団)における母分散(母集団の特徴をあらわす分散)を偏りなく推定するときに使用する統計量。 分散との求め方の違い→分散は偏差の2乗の平均を取るため、偏差の2乗の合計を標本数(n個)で割るのに対し、不偏分散は標本数から1引いた値(n-1)で割る
分散の平方根。
長所:平方根を計算することにより、標準偏差の単位はもとの変数の値と一致し、解釈しやすくなる→標準偏差が散布度として最も頻繁に使用される
短所:抵抗性は高くない
最大値から最小値を引いた値。データの標本数が少ないときに手軽に利用される散布度の指標。抵抗性は低い 四分位範囲は第三四分位数(降順上位25%)と第一四分位数(上位75%)の差
四分位偏差=四分位範囲/2
変動係数(coefficient of variation)
求め方:標準偏差を算術平均で割る
標準偏差の平均に対する相対的な大きさを評価する指標→負の数を含むデータは利用不可
百分率で示す
相対的な大きさを係数として算出するため、単位が異なる者同士の比較が可能
引用・参考
要約統計量についてまとめてみた - Qiita
データの代表値と散布度について - Study channel