交絡
confound
因果関係における、第三の変数
別ルートの因果関係(バックドアルート)の要素
交絡(こうらく、英: Confounding)は、統計モデルの中の従属変数と独立変数の両方に(肯定的または否定的に)相関する外部変数が存在すること。そのような外部変数を交絡変数(confounding variable)、交絡因子(confounding factor、confounder)、潜伏変数(lurking variable)などと呼ぶ。したがって科学的研究では、第一種過誤(従属変数が独立変数との因果関係にあるという偽陽性の結論)と呼ばれるこれらの要因を避けるよう制御する必要がある。2つの観測された変数のそのような関係を擬似相関という。すなわち交絡が存在する場合、観測された現象の真の原因は交絡変数であるにもかかわらず、独立変数を原因と推論してしまう。
https://gyazo.com/48b86336ff5be79160b2ce9c91780344
最近の研究で、コーヒーには、血管内で血液が固まってできる血栓を縮小させる効用があるため、血栓による脳卒中や急性心筋梗塞を予防する効果があることが明らかにされつつある。しかし、ある調査では、これとは逆に、コーヒーをよく飲む人は、脳卒中を起こしやすいとの因果関係が導かれた。
このようなときは、交絡因子の存在を疑ってみる必要がある。同様の疫学調査で、よく見られるのは、喫煙が交絡因子となっているケースだ。実際に、この調査では、コーヒーを飲む人に、喫煙をする人が多く見られた(条件(1))。また、喫煙は、脳卒中の発症予防に影響を与えることが知られている(条件(2))。更に、喫煙は、コーヒーと脳卒中の中間因子ではない(条件(3))。このため、喫煙は、コーヒーの飲用(原因)と脳卒中の発症予防(結果)における、交絡因子の条件を満たすことになる。この調査では、喫煙の影響を除いて、因果関係を検討し直すことが必要となるだろう。
交絡因子の影響を除外するための方法は、いくつか知られている。例えば、上記のコーヒーと脳卒中の因果関係のケースでは、喫煙者を調査対象から外すことが考えられる。また、コーヒーをよく飲む集団と、あまり飲まない集団の、喫煙者割合を均一にするよう、2つの集団に喫煙者を均等に含めることも考えられる。このように、調査対象をコントロールすることが、1つの方法となる。
交絡という不思議な現象と交絡を取りのぞく解析
https://gyazo.com/4c219edf7c8385c3933df048a0b54410
交絡因子を考える