平均値、中央値、最頻値
平均値(mean, average)
平均値(mean, average)とは、データの総和をデータの個数で割ったもの
平均値には、算術平均、加重平均、幾何平均、移動平均がある
メリット
全ての分布に存在する
ひとつだけ存在する値である
計算が簡単である
全てのデータ活用する
意味がわかりやすい
統計計算に必要となる
デメリット
外れ値や極端値に影響を受ける
適切な代表値でない場合がある
中央値(median)
中央値(median)は、データを最小値から最大値までを順番に並べたとき、ちょうど真ん中にくる値。データの個数が偶数の場合は、ちょうど真ん中にくる2つの値の平均をとる。中央値は50パーセンタイルとも呼ぶ。50パーセンタイルは、データを最小値から順番に並べた時に、ちょうど50%のところに位置する値のこと
メリット
外れ値や極端値の影響を受けない
ひとつだけ存在する値である
複雑な計算がない
デメリット
大量のデータがあると序列をつけるのは簡単ではない(コンピュータを使用すれば簡単だが)
全てのデータを活用していない
最頻値(mode)
最頻値(mode)とは、データや確率分布の中で最も頻繁に出現する値
メリット
外れ値や極端値の影響を受けない
複雑な計算がない
デメリット
最頻値が存在しない場合がある
最頻値が2つ存在する場合がある
データ数が少ないと、あまり意味がない
【統計学の入門サイト】統計学ドットリンク https://toukei.link/basicstatistics/mean-median-mode/ より引用
#代表値
#テーマ2