相関関係と因果関係の違いの具体例
#テーマ3
相関関係と因果関係の違いの具体例をあげます
交番の数が多いほど犯罪件数が多い
A交番の数が多い、B犯罪件数が多い
この場合はB→A(逆の因果関係)が考えられる
育毛剤を使っている人ほど、10年後にハゲやすい
「アンケートで育毛剤を使っている人100人と使っていない人100人を集め、それぞれを10年間追跡調査したところ、使っていた人は45%が薄毛になっていたのに対し、使っていなかった人は30%だけが薄毛になった」
この調査では、すでに育毛剤を使っている100人が調査対象となっている。この100人は「すでに薄毛の兆候が見えている」か「親が薄毛だから、早い段階から予防しようとしている」可能性が高い。つまり、そうでない100人よりも10年後に薄毛になる確率も高くなってくると考えられる。
この場合「共通の要因(C→A C→B)」、すなわち遺伝などの第三の要素が原因になっている。
このように2つの事象に因果関係がないのに、見えない要因によって因果関係があるかのように推測されてしまうことを擬似相関と言う
猫が顔を洗うと、雨が降る
「雨が降る前は湿気が多くなりやすい」→「センサーの働きをしているひげが敏感に反応し、その感度が落ちないようにひげを拭う可能性が高くなる」のが原因。
この場合「共通の要因(C→A C→B)」のせいで時系列が前後したため、実質的に「逆の因果関係(A←B)」にあるのが分かりにくくなっているケース
インターネットが普及するにつれ、地球温暖化が進行
相関関係があったとしても、そこに因果関係も「共通の要因」もないケースもある。つまり、「単なる偶然」
例えば、ここ数十年でインターネットの普及率は飛躍的に高まり、また地球温暖化も進んでいる。だからと言って「ネットが普及した」から「温暖化が進んだ」という因果関係があるとは考えにくい
趣味が盆栽という人ほど、お金持ちである
真っ先に疑うべきは「年齢」という「共通の要因(C→A C→B)」
盆栽が趣味という人は、高齢な方に多いもの。そして、年齢が高ければそれだけ蓄えも多いはず。
また、「お金を持っている」から「盆栽を楽しむ余裕がある」=「逆の因果関係(A←B)」の可能性も考えられます。
さらに言えば、その統計データを取ったのが「その商品を販売している会社」であれば、「何度もデータを取って、たまたま高い標本相関係数が出た時に記事にした」=「単なる偶然」の可能性すらある。
まとめ
「A→B」と言われた時は、「A←B」の可能性も考えてみる
例)暴力表現のあるゲームをする子供は、非行に走る可能性が高い。こんなゲームは規制すべきだ
⇒非行に走りやすいタイプの子供が、暴力表現のあるゲームを好む可能性が高いのでは?
⇒暴力表現のあるゲームは、むしろストレスを発散して非行の予防になっている可能性も?
「A→B」と言われた時は、共通する要因「C」の存在を考えてみる
「年齢」という要因が考えられる時は、「年齢別に見た時の統計データ」を調べる
集計期間に差がある時は、「季節的な要因」がないか考えてみる
偏相関係数を求めれば、第3の変数「C」による影響を除いたAとBの相関関係を調べることができる
過去の実績データに基づく相関関係を因果関係だと安易に考えない
過去の実績データでは、集計の仕方などで偏りが起きやすい
ランダム化比較実験であれば、因果関係を証明しやすい
参考 アタリマエ!相関関係と因果関係の違いが一発でわかる具体例5選
https://atarimae.biz/archives/7374 20201129