箱ひげ図
【特徴】
箱ひげ図はデータのばらつき具合を示すのに用います。データのばらつきはヒストグラムでもみることができますが、箱ひげ図は異なる複数のデータのばらつきを比較する事ができます。
箱ひげ図は四分位を用いてデータの散らばりを表します。四分位とはデータを昇順に並べて、4等分したものです。小さい値から数えて、総数の1/4番目に当たる値が第1四分位、真ん中に当たる値が第2四分位(=中央値)、3/4番目にあたる値が第3四分位となります。
都道府県別人口10万人当たりの医師の数について、下図で2004年と2006年とを比べると、全体として増加しているものの、最大値の増加が大きいことが見てとれます。
https://gyazo.com/7aeb0d0722f1428d1252193d1e46a0b2
【作成方法】
Exelには箱ひげ図を作成する機能はありませんので、積上げ棒グラフから作成。
まず、積上げ棒グラフを作成するための必要なデータを作成。
① 各月の四分位点と最大値、最小値を求めます。
四分位点は関数の「QUARTILE」を使って計算できます。例えば第1四分位点であれば、表のセルに「=QUARTILE(データの範囲,1)」と入力すると算出できます。第2四分位点は「=QUARTILE(データの範囲,2)」、第3四分位点も同様に計算しましょう。
最小値は「=QUARTILE(データの範囲,0)」、最大値は「=QUARTILE(データの範囲,4)」で算出できます。なお、最小値は「=min(データの範囲)」、最大値は「=max(データの範囲)」でも計算することができます。
②四分位点の差を計算し、表を作る
第一~三四分位数をそれぞれQ1,Q2,Q3、最大値、最小値をmin,maxとすると,
min-Q1, Q2-Q3 ,Q3-Q2, max-Q3をそれぞれ計算し、表を作ります。そのあと積み上げ棒グラフでグラフ化し、塗りつぶしを白色にします。
※詳しくは、以下のウェブサイトを参考。
参考文献:なるほど統計学園高等部 箱ひげ図
https://www.stat.go.jp/koukou/howto/process/graph/graph5.html
#テーマ2