〈T2〉データの分析・分布01:分布の可視化
#テーマ2
データの分布にあたっては、テーマ1で紹介したように、可視化が役に立つ。
一方で、データの分布を可視化するにあたっては、以下の手段が主流である。以下の可視化の手段について、ここでは検討することにする。
度数分布表
キーワード:度数分布表、階級、階級値、度数、相対度数、累積相対度数
ヒストグラム
度数分布表
https://gyazo.com/38c3187a941cbc0b4deaa62965417291
上記のようなデータがあったとする(個人的に作成したものである)。
データを整理するために用いる区間を階級という(上記の表でいう0~2、2~4など)。この区間の幅(上記表でいうと2時間)を階級の幅という。また、階級の真ん中の値を階級地という。(いずれも、高等学校数学科用・文部科学省検定済教科書・数学Ⅰ、東京書籍、156頁)
それぞれの階級に入っているデータの値の個数を、その階級の度数という(上記の表でいう右側の数値のこと)。各階級に度数を対応させたものを度数分布といい、それを表にしたもの(すなわち可視化である)を度数分布表という。(いずれも高等学校数学科用・文部科学省検定済教科書・数学Ⅰ、東京書籍、156頁)
ヒストグラム
度数分布をグラフにした図がヒストグラムである。階級の幅を底辺、度数を高さとする長方形を隙間なく並べたものである。(高等学校数学科用・文部科学省検定済教科書・数学Ⅰ、東京書籍、157頁)