「分布」を考えるということ
例えとして・・・血液型性格診断
以下、あくまで例えとして……
血液型性格診断ってよくありますよね
各血液型の性格の特徴は…
A型:真面目、几帳面、神経質
B型:マイペース、好奇心旺盛、自己中心的
O型:おおらか、社交的、大雑把
AB型:天才肌、感性、変人
B型の人、こんなこと言われませんか?
「B型の奴ってめんどくさいよね~」とか……
初対面の人に「俺B型無理やわ~」とか……
つまりこれらは、「B型は全員こういう性格」という前提がありそう…
血液型と性格の関係には否定的見解寄りの諸説あるが、仮に血液型と性格の間に「傾向」があったとしても、「全員が」そのような性格、なわけがない
仮に傾向があっても、それは「分布」しているはず
代表的な値で集団を語っていないか?
データは分布する、という意識が重要
以下はあくまで仮のデータによる例ですが
https://gyazo.com/7d1da0ec15e23c732ee3ec5e06c78270
データの分布を意識する
真面目な話、こういうことはとても多い
昔は、就職の面接で聞かれたとかとんでもない例もあったそう
データの分布についてよく知っておくことは超重要
統計学をしっかり学び、確率分布について正確におさえておくとよいが、この授業では数学的な確率分布以前の基礎として、データの分布をみるときの基本的なポイントをおさえたいと思います
データの数値要約(代表値、散布度)について知る
可視化手法としての度数分布とヒストグラムについて知る
データの数値要約
データの分布の特徴を数値で表わす方法
どう違う??
度数分布表とヒストグラム
データの分布を図表で可視化する方法
データがどの範囲にどのように分布しているか、を知るために有用な表とグラフ
度数分布表の要素
ヒストグラムはどう描く?
ただの棒グラフではない!