データの扱いに起因するバイアス
from データに潜むバイアス
データの扱いに起因するバイアス
都合のいいデータを集めることによるバイアス
チェリーピッキング
自説や組織の決定などを正当化する都合のいいデータだけを集めること
学術論文でも、「p-hacking」などの問題が起こっている
公開されているデータは、何らかの方針によって集められた歪みがあるかもしれないという視点をもっておくとよい
確証バイアス
人間は、自分の仮説や信念に整合する情報を無意識に選択(矛盾する情報は無視)する傾向がある
そういう心理的傾向が(本能的に)あるということを自覚しておくことが大事
人為的ミス
データの入力間違い、数式処理の誤り等々、ヒューマンエラーは多い
「そういうミスがあるかもしれない」と常に疑っておくことが重要