母集団とサンプリング
母集団とサンプリング(標本調査)
母集団とサンプリング
分析対象となる全てのデータからなる集団を母集団(population)という 例)日本人の政治に対する意識調査を行う場合、母集団は日本人全体
例)国勢調査
部分から全体を推測する
全数調査は困難なことが多い(数が多すぎる、コストがかかる、などなど)
部分的な標本(サンプル)をもとに、全体(母集団)について「何か言えることを言う」ことをめざす
https://gyazo.com/f2772be2358b6c599124ddd38ef2a8d9
「分布」と実現値としてのデータ
母集団はなんらかの分布をしており、個々のデータは、その分布から生み出されたものと考える 実際に手に入る「標本」は、この確率分布からの実現値(観測値)であると考える この実現値をもとに、データを生み出した確率分布を推定する
https://gyazo.com/7734dfceaa6b1a3549d4ce289787130e