中央値(メディアン)
中央値とは
データを大きなものから小さなものへと順番に並べたときに、ちょうど中央に位置するデータです。
たとえば、5個のデータがあったとしたら、小さいほうから(または大きいほうから)3番目のデータが中央値です。
データの個数が奇数のときと偶数のときで算出方法が変わります。
奇数の場合 『(n+1)/2』番目のデータ
偶数の場合 『n/2』番目と『(n/2)+1』番目のデータの平均をとる
これが中央値の計算方法です。試しに計算をしてみます。
データ数が7個の場合の計算
8、10、12、14、15、16、16
データ数n=7、奇数ですから、『(7+1)/2』番目は、4番目の数字です。 上記の並びで4番目のデータを見ると14ですから、中央値は14。
データ数が8個の場合の計算
8、10、12、14、15、16、16、18
n=8で奇数ですから、『(8/2)』番目と『(8/2)+1』番目の数値の平均ですから、4番目の数字と5番目の数字の平均値が中央値になります。
上記の並びで4番目は14、5番目は5ですから、
(14+15)/ 2 = 14.5
14.5 が中央値ですね。
中央値の長所と短所
長所
1.外れ値や極端値の影響を受けない
データを順番に並べた時に、端の方に外れ値や異常値があっても、中央値では何番目か数えるだけで、外れ値を計算に活用しません。
2.ひとつだけ存在する値である
3.複雑な計算がない
短所
1.大量のデータがあると序列をつけるのは簡単ではない(コンピュータを使用すれば簡単ですが。)
2.全てのデータを活用していない
閲覧日2019年11月3日
平均値と違い、外れ値の影響を受けないところが良い。