記述統計
from データを扱うときの統計学的思考
データの統計的な特徴を記述すること
たとえば、「食堂のカレーの量が日によって違うような…」と感じたYさんが、食堂で提供されるカレーライスの重さをコツコツと調べたとします…
https://gyazo.com/0fd22e634678a1597447f9bd6c76b225
18皿ぶんのカレーの重さが下の表のようにまとまっていたとする
https://gyazo.com/a96237615f2ece3e13095b055917b037
このデータからは、平均 295.3g, 標準偏差 11.5g, 最大値 312.3g, 最小値 269.5g などの統計的な特徴が記述できる
記述統計
記述統計(学)
「集団としての特徴を記述するために、観測対象となった各個体について観測し、得られたデータを整理・要約する方法」(東京大学教養学部統計学教室(編), 「基礎統計学Ⅰ 統計学入門」, 1991より)
数値要約、可視化など、データの特徴を記述するための方法
データを扱うための基本中の基本
基本=カンタン、ではなく、あらゆる「前提」としてあまりにも重要なもの
分析対象となる集団のデータを完全に知り得る場合は記述統計の方法で事足りる
しかし、全体ではなく、部分的にしか情報が得られない場合がある(多い)。その場合はどうするか?
先のカレーの重さの例で、本来知りたいのは何か?
「この18皿」の特徴が知りたいのか?
本当は、「食堂で提供される全てのカレー」についての情報が知りたいはず