代表値
データ全体を要約する値のことで、その名の通りデータを代表する値。平均値や最頻値、中央値などがあり、代表値の選択には分布の形に注意する必要がある。
https://bellcurve.jp/statistics/glossary/1783.html
平均値(算術平均)
全てのデータの値の合計を、データの個数で割った値
中央値
データを小さい順から並べた際に真ん中にあたるデータの数値(偶数の場合は真ん中にあたる2つの数値の平均)。
外れ値の影響を受けにくい(「抵抗性がある」という)。
名義尺度以外のデータで計算することが可能
階級の幅、間隔による影響を受けにくい
https://qiita.com/icchy_sh33p/items/82f2bc7d789b74110f7b
平均値と違って、外れ値の影響を受けにくいため、中央値と平均値の間に大きなずれがある場合、歪度が極端に大きい可能性が高い
最頻値
データの数値の分布が単峰形のとき、最も現れやすいデータの数値(分布の形の頂点にあたる箇所)
すべての尺度で求めることが可能
外れ値の影響を受けることがなく、抵抗性が高い
間隔尺度、比率尺度の階級の幅、間隔による影響を受けやすい
データの数値の分布の山がふたつ以上(現れやすいデータがふたつ以上)のものには使用するのに向いていない
引用・参考
代表値 | 統計用語集 | 統計WEB
https://bellcurve.jp/statistics/glossary/1783.html (2021/2/1)
要約統計量についてまとめてみた - Qiita
https://qiita.com/icchy_sh33p/items/82f2bc7d789b74110f7b (2021/2/1)
#テーマ2