【コロナでわかる】相関と因果
https://gyazo.com/116241cb8022c8ac8df0083d2da929b1
まず相関関係とは、「一方の値が増加(or減少)する時、もう片方も増加(or減少)する」という関係である。
例えば、「外出する頻度が高い人ほどコロナに感染しやすい」と言うデータがあったとすると、「外出頻度」と「コロナ感染リスク」には正の相関があると言える。
対して因果関係とは、「一方の値の変化がもう片方に影響を与える」と言う関係である。
上の例だと、コロナにかかりやすくなる原因は「外出すること」自体ではなく、その先で「人と接触すること」である。
この時、「コロナ感染リスク」は「外出頻度」と因果関係はなく、「人との接触回数」と因果関係があるといえる。
他の例も見てみよう。
「風が吹くと桶屋が儲かる」と言う言葉があるが、この場合「風が吹く」と「桶屋が儲かる」には相関関係がある。
しかし上の2つには因果関係はなく、「風が吹く」→「 土埃が目に入る」→「盲人が増える」→ 「盲人が三味線で生計を立てようとする」→「三味線に使う猫皮が要る」→「猫が減りネズミが増える」→「ネズミが桶をかじる」→「桶屋が儲かる」という、計7つの因果関係によって成り立っている。むちゃくちゃやんこの話
このように、相関関係をもっていても因果関係を持っていない場合があるため注意が必要である。
こういうのはいわゆる擬似相関というものだそうで、051さんのノート(/kyoyo-ds2020-051/擬似相関)にわかりやすくまとめられている。
参考文献
濱野正樹「データを使う力を高める=相関関係と因果関係編【第5回】」DIGITAL X 2020年10月12日 https://dcross.impress.co.jp/docs/column/column20200722/001805-2.html 2020年12月3日閲覧
#テーマ3