箱ひげ図
箱ひげ図では、四分位を使用して数値の分布と中心傾向を視覚化および比較できます。四分位は、最小値、第 1 四分位値、中央値、第 3 四分位値、最大値という 5 つのキー値に基づいて数値を 4 つの等しいグループに分割する方法です。
引用
「箱」と「ひげ」によってデータの多様な要素を一つの図の中に盛り込んでいる。
箱ひげ図の構成要素[1]
https://gyazo.com/29167058ea570c910b07e590fa5b914e
中央値:データを昇順または降順に並べたとき、中央に位置する値。 四分位数:データを昇順または降順に並べ、四等分したときの各境目の値。中央値は第2四分位数。
四分位範囲:第1四分位数(全体の25%)から第3四分位数(全体の75%)までの範囲。箱の2辺。
最小値/最大値:ひげの上端が最大値、下端が最小値。
外れ値:データの中で突出した値。ひげに含めずに、点で表記する。
特徴
データの平均値でなく中央値を採用すること、突出した点を外れ値として別で扱うことによって、極端な値に影響されずにデータの分布を見ることができる。 ヒストグラムは棒同士が隙間なく接しており、異なるデータのヒストグラムを並べて比較することは難しい。しかし箱ひげ図は複数並べて比較することが用意であるため、複数データのばらつきの比較に役立つ。 画像の出典
参考資料