サンプリングバイアス
選択バイアス(3) サンプリングバイアス
分析対象となる母集団からのサンプリングの際に偏ったデータを抽出してしまうことによるバイアス
下の例では、たとえば「月曜日のカレー」のみを抽出してしまうなど
https://gyazo.com/5e1c7db161ae75eb049cace21d63f28f
サンプリングバイアスの例
とある研究の被験者を募集した場合
意欲が高い、実験内容に関心がある、謝金がほしい、等々のなんらかの志向を持つ被験者に偏ったサンプルになりがち
これはとくに志願者バイアスとよばれる
ビジネスでは、すでに自社製品を購入している既存顧客に関するデータは手に入りやすいが、潜在的顧客のデータは得にくい
既存顧客のデータを分析しても潜在的顧客の関心やニーズはわからないかも・・・
某新聞社のWebサイトにて、2022年の参院選に関するアンケートがあった
その結果が以下のように発表されていた・・・(図はイメージ)
https://gyazo.com/26622d16d0c9ec3e8d10e277379fcfde
ここにあるバイアスは・・・?
サンプリングバイアスを避けるために…
サンプリングバイアスを避けるには、母集団からランダムにサンプルを抽出すべき
これを無作為抽出という
「味噌汁をよくかき混ぜて味見する」のようなイメージ
実際にはさまざまなサンプリング方法がある
層化多段抽出法など
https://gyazo.com/451bf61460bce71f1a3b0a2f843604cd
https://gyazo.com/04833d34bd9224031bdffdea32c089ac