四分位数
分位数
分布を表す指標として、初級編では代表値(平均値、中央値、最頻値)や範囲(レンジ)について説明しましたが、もう少し詳細に分布の形状を明らかにするためには、分位数(分位点)が用いられます。
分位数とは、データを大きさの順に並べ、データ全体をいくつかのグループに等分したときの境界となる値のことをいいます。よく使われるものとしては、4等分した四分位数があります。
分位数は分布の形状を明らかにするために用いられる
データ全体をグループに等分した境界となる値
四分位数とは
最初の境界値を第1四分位数($ Q_1)、次の境界値を第2四分位数(中央値$ Mと同値)、更に次の境界値を第 3 四分位数($ Q_3)と呼びます。また、データ全体を100等分する場合は、それぞれ1パーセント点、99パーセント点などと呼ばれます。
なお、最小値、第1四分位数、第2四分位数(中央値)、第3四分位数、最大値の五つの数をまとめて、5数要約と呼び、分布の形状を判断するために用いられます。
分位点の一種
参考サイト
http://www.stat.go.jp/dss/getting/pdf/mid.pdf
サイト名 : データサイエンス・スクール
タイトル名 : 中級編
ページ : 6
#テーマ2