データの分析
https://gyazo.com/528ef8d264bc20ab01de5aad45bd4591
高校数学の数ⅠAで1つの単元となっている事としてもなじみ深いと思います。
様々な方法を用いてデータを可視化するところはテーマ1と同じなのだが、
「データの分析」という単元であつかわれている図などは少々知識がないと、データの特徴やそこから読み取れること、正しいことなどを読み取るのは難しいという印象。
テーマ②の問い
◼ なぜデータの分布を考える必要があるのか?
→何か一つのデータを見てどうこう言うことはできないから
例えば2つのテストで80点を取ったという事象に対し、どちらがすごいかという問いに対する答えは他のテスト受験者の点数(平均点など)に依存します、
また平均60点の2つのテストがあり、どちららも80点取ったとしても、すごさが同じとは限らず、他のデータの分布によって印象は変わります。
◼ データの分布にはどのような種類があり、現実のデータはど
のような種類の分布をするのか? ※
ベルヌーイ分布
二項分布
ポワソン分布
指数分布
一様分布
ガンマ分布
正規分布
T分布
◼ データの分布の特徴を数値で要約する方法にはどのようなも
のがあるのか?
代表値: 平均値と仮平均法
代表値: 中央値(メジアン)と最頻値(モード)
四分位数
分散、標準偏差
相関係数
偏差値
変数変換
◼ データの分布を図表で可視化する方法にはどのようなものが
あるのか?
#ヒストグラム
#箱ひげ図
度数分布表
散布図
◼ これらの方法は表計算ソフトやプログラミング等でどう実現
するのか?
※参考;11/1
Qiita
統計学、データ分析でよく出てくる確率分布まとめ
https://qiita.com/katsu1110/items/b0213c7ef6a8122abfc5
#テーマ2
#データの分析