代表値
#テーマ2
代表値とは、データを分析する際、主に使われる以下の3つ値のことである。
平均値
全データの数値を足して母数で割った値。テストの平均点、平均身長、平均体重、平均気温などはよく耳にする。
対象とするデータの値知る上で一番よく使われる。ただし、極端に大きい、または小さいなどの外れ値に影響されてしまったり、データの平均を取る行為そのものが適切ではない場合もある。
中央値
数値の高い順など何らかの基準を持ってデータを並べた場合、データの中央にある値のことである。
例えば、データが1,4,7,9,11の5個(奇数)であった場合、3番目の7が中央値となる。
データが奇数ではなく、1,4,5,7,8,10の6個(偶数)であった場合には、3番目と4番目の5と7を足して2で割った値の6が中央値となる。中央値は平均値のように外れ値に影響を受けることはないが、データが100個、1000個など膨大な数であった場合に全データの内98%以上を無視していることになる。なので、中央値以外の数値にも気を配る必要がある。
最頻値
最もよく現れる値もしくは階級のことである。10点満点のテストでそれぞれの点数が1,2,6,6,6,7,8,8,10となった場合6が3回現れていて、その他の値は2回、もしくは1回なので、6が最頻値となる。100点満点のテストであれば、1点ごとに区切るのではなく、50点~60点の間で区切ることもある。その場合、50と60を足して2で割った値の55が最頻値となる。
以上の3つの値は手っ取り早くデータの特徴を理解できる(できた気になっているだけの場合もある)ため、真っ先にその数値を確認することが推奨されるが、この3つのデータだけでは分からないものも多く、それだけで判断するのは危険である。
参考文献
運営団体:統計学がわかった!(個人ブログ)タイトル:代表値とは?平均値、中央値、最頻値の違いと使い分けを紹介
URL:https://toukeigaku-jouhou.info/2015/08/22/post-37/ 日時:2020/10/31