相関と因果の混同
from 層別の相関、擬似相関、相関と因果
「相関」と「因果」
「相関関係がある」ということは、「因果関係がある」といことを必ずしも意味しない
たとえば、体重と身長は一般に相関関係にあり……
「体重が重いほど、身長が高い」ということはいえる(→相関がある)
「体重を重くすると、身長が高くなる」ということはいえるか??→ 体重は身長の原因??
「相関」と「因果」の混同に気をつける必要がある
ただし、突き詰めると実はかなり難しい……
なぜ「因果関係」を知る必要がある?
相関関係がわかれば、予測はできる → 相関関係と「予測」
変数Aの値がわかると、変数Bの値を予測できる
因果関係がわからなくても予測はできる
相関係数の絶対値が大きいほど精度良く予測できる(→回帰分析の話へ…)
予測だけではなく、人為的に「介入」して対象を変化させたい場合には因果関係を捉えておく必要がある
Aが大きいときにBも大きい、は相関関係
Aを大きくすればBも大きくなる、は因果関係
(参考)因果関係をどうやって判定するか?
因果関係判定のガイドライン(Hill, 1965)
事象Aが事象Bの原因である、または変数Aの値の高低が変数Bに因果的な影響を与えていると結論付けるための9つの基準
1. 相関関係の強さ:Aの生起とBの生起の間に強い相関関係がある。
2. 相関関係の一致性:相関関係の大きさはさまざまな状況で、対象や実証に利用する手法が違っても一致している。
3. 相関関係の特異性:Bと、「A以外に原因として想定される変数」の相関は高くない。またAと「B以外の結果変数」の相関も高くない。
4. 時間的な先行性:AはBに時間的に先行する。
5. 量・反応関係の成立:原因となる変数Aの値が大きくなると、単調に結果となる変数Bの値も大きくなる。
6. 妥当性:AがBの原因になっているという因果関係が生物学的に(または各分野の知見にもとづいて)もっともらしい。
7. 先行知見との整合性:これまでの先行研究や知見と首尾一貫している。
8. 実験による知見:動物実験等での実験研究による証拠がある。
9. 他の知見との類似性:すでに確立している別の因果関係と類似した関係・構造を有している。
(参考:星野崇宏「調査観察データの統計科学」(2009) P.140)
(参考)因果関係を調べる方法
ランダム化比較試験(RCT)
介入するかしないかをランダム(無作為)に割り当てた 実験により因果関係を検証する方法
コスト、倫理面等で実施できないことも多い
統計的因果推論
無作為割り当てでない観察データから 因果関係を推論する方法
層別解析、回帰モデル、傾向スコアマッチングなど
共分散構造分析
構造方程式モデリング(SEM)
直接観測できない潜在変数を導入したうえで 複数の変数間の因果構造を推論する方法