ヒストグラムの形状
ヒストグラムには分布の形状で、単峰型(山が1つ)と多峰型(山が2つ以上)の大きく2つに分類され、さらに、左右対称かどうか、外れ値があるかどうかなどでの分類がされる。
1.単峰型
最も基本的なヒストグラムの形でピークが一つ(単峰性)で左右対称
データのもと になる集団が同じ性質を持っていれば(同質であれば)、山の頂点を中心に左右対称の形状 を示すことが多い
単峰性のヒストグラムにはとがった山型を示すものや、なだらかな山型を示すものがある。
鋭くとがった山型はばらつきの小さい分布を表し、なだらかな山型はばらつきの 大きい分布を表す
https://haku1569.up.n.seesaa.net/haku1569/image/20150210_01.JPG?d=a0
画像元 数値データの分布をみるヒストグラムについてまとめてみた/データ分析の解説
2.多峰型
ヒストグラムに複数の山がある分布を多峰型の分布という
測定した集団に異なる別の集団が含まれているような場合にできる
https://haku1569.up.n.seesaa.net/haku1569/image/20150210_02.JPG?d=a0
画像元 数値データの分布をみるヒストグラムについてまとめてみた/データ分析の解説
3.歪んだ分布
ヒストグラムが左右非対称の山型となる分布を歪んだ分布という
右側に長く裾をひく分布を「右に歪んだ分布」という
https://toukeigaku-jouhou.info/wp-content/uploads/2018/01/skew-distribution-2.jpg
左側に長く裾をひく分布を「左に歪んだ分布」という
https://toukeigaku-jouhou.info/wp-content/uploads/2018/01/skew-distribution-3.jpg
画像元 分布の歪みとはなにか。また、右に歪んだ分布とはなにか
集団の多くが示す値と離れたところにある少数のデータを外れ値という
外れ値が存在する場合には入力ミスや異質なデータが混在していないかの確認が必要
https://haku1569.up.n.seesaa.net/haku1569/image/20150210_04.JPG?d=a0
参考文献