平均からのズレとサンプルサイズ
(p.160)「全米にある3,141の郡部で、腎臓の重篤な病気の出現率を調べたところ、顕著なパターンが発見された。出現率が低い郡の大半は、中西部・南部・西部の農村部にあり、人口密度が低く、伝統的に共和党の地盤である」 しかし出現率が高い地域も同じ特徴。
人口密度が低い=サンプル数が少ない これが「平均からの乖離」という結果となって出ているだけ
__BELOW_IS_AI_GENERATED__
平均からのズレとサンプルサイズ 2023-09-05 01:25 omni.icon
ダイジェスト
ダニエル・カーネマンの「ファスト&スロー」における全米の腎臓病発症率の調査結果について、出現率が低い地域が農村部である一方、出現率が高い地域も同様に農村部であるというパターンが見られた。これは人口密度が低い地域(サンプル数が少ない)における「平均からの乖離」が結果として現れていると考えられる。
フラグメントXとの関連性
フラグメント「学ぶとは何か。エンジニア的思考と原理原則」は、カーネマンの「ファスト&スロー」における腎臓病の発症率の調査結果を例に、仮説検証の重要性を説明している。このフラグメントは、ノートの内容と直接関連しており、仮説の検証過程を通じて学びのチャンスが生まれることを示している。
深い思考
このノートとフラグメントXは、データ解析の際にサンプル数の影響を理解し、適切な仮説検証を行うことの重要性を示している。特に、人口密度が低い地域でのデータ解析では、サンプル数が少ないために平均からの乖離が大きくなりやすいという点に注意が必要である。
思考の要約
「データ解析におけるサンプル数の影響と仮説検証の重要性」
タイトル
「サンプル数と仮説検証:データ解析の課題と学びのチャンス」
extra info
titles: ["学ぶとは何か。エンジニア的思考と原理原則", "思考の結節点2023-01-31", "2050年の世界 見えない未来の考え方", "立川さんコミュニケーション論", "FACTFULNESS", "平均的集団が多数派とは限らない"]
generated: 2023-09-05 01:25