分布の可視化
1.度数分布表
度数分布表とは、データを整理し可視化する手法である。ある階級を定め、その階級に含まれるデータの個数をまとめた表である。
ある一定の幅で定めた値の範囲を階級という
ある階級の下限と上限の値の平均値を階級地という。これは度数分布表における平均値を求めるときに使われる。
ある階級に含まれるデータの個数の値を度数という
ある階級の度数が全体に占める割合を相対度数という
度数分布表の上から相対度数を足したものを累積相対度数という。累積相対度数は度数分布表の下端では必ず100(%)、または1.00となる。
https://gyazo.com/f4149057b63cb514a39d8e84065ff845
2.ヒストグラム
ヒストグラムとは、端的にいえば度数分布表を視覚化したもので、棒グラフのような形状である。
ヒストグラムは(長方形の面積)=(度数)×(階級幅)を満たす。そのため、ヒストグラムによって誤った視覚的な印象を与えることはない。
https://gyazo.com/ac90bace8d9de675354a98bfefc19bc2