因果推論
入力データ(インプット)と出力データ(アウトプット)から、その因果関係(原因とそれによって生じる結果との関係)を統計的に推定していく考え方のこと。統計的因果推論とも言われる。 「因果推論(Causal inference)」とのみ言う場合は、統計学に限らず哲学などを含めた、より広範な領域の議論を含むが、統計学、データサイエンス、経済学に関連する文脈で「因果推論」と言われる場合、しばしば「統計的因果推論」の手法に関わるものを指していることが多い。物事の原因となったと想定されるものを処置変数(トリートメント)、その原因に影響を受けたと想定されるものを結果変数(成果・アウトカム)と言います。また処置が結果に与えた影響の大きさを因果効果と言いう。 <因果推論のポイント>
①処置群と対照群の結果から、処置群における「もし、◯◯だったら」の効果を推計する ②処置群と対照群のサンプル構成は◯◯以外の要素は同一になるよう補正する
③すべての要素を同一にできないため、結果に影響を及ぼす重要な要素を抽出する
<主な手法>
「統計的因果推論」にて主に用いられる手法としては
因果関係があるどうかを判断するというのは意外と難しく、その理由の一つは人間は相関関係を因果関係を誤認してしまうことがある。→交絡