Tutorial: Causal Inference and Counterfactual Reasoning
聴講メモ
Microsoftの因果推論チーム? によるチュートリアル
Office Mac 2011のPower Pointで資料を開くと数式がレンダリングされない。買い換え時か。
最初は因果の重要性とShimpson's Paradoxから
反実仮想を表現する数式はずっと無かったらしい
P(Y | do(x))
https://gyazo.com/952fe53e0a743da5fa6cce56946b33b1
From (1)
Structual Causal Modeling
よく見る図
https://gyazo.com/e76239cb1c7bf5bbae5d0c4c9bd13334
X: Cofounder (交絡因子)
Y: Outcome
T: Treatment
トリートメントを受けた人がもしトリートメントを受けなかった場合にY=1となる確率の表記
$ P(Y=1 | T=1, do(T=0))
これは初めてみた
バックドアパスがある時は条件付けが必要、ランダム化せよ
Randomized experiments → X ⫫ T の状況を作る
Observational study
観察研究で使うメソッド
層化
年代毎にデータを区切ってATEをみる
Matching
似た人同士をconter factualとして扱う
マハラビノス距離によるマッチング
傾向スコア(Propensity score)によるマッチング
e(X) = P(T=1 | X)
T ⫫ X | score
Pythonコードで説明されるとわかりやすい
Propensity Scoreの何が良いのかわかってなかったけど理解した。反実仮想インスタンスを選ぶ時にcovariatesの空間で近傍を取らなくても、ここではbackdoor pathの影響を除去するのが目的だから1次元のPropensity Scoreに写像した後の近傍を取っても良いんだな。
Stratifaction (層化)
年代別に区切ってATEを計算?
Propensity Score stratifaction
似てる人をグループ化 (傾向スコア順にソートして A, B, C のグループ)
それぞれのATEにTreatment数でweightをかけた物をsum
Weighting
Treatment数を使うのではなく……??
Regression
OLE?
注意
マルチコ
交絡因子を省略しない
交絡因子を省略すると誤差項と説明変数の間に相関がある状態となり最小二乗法の前提をみたさない
交絡因子の網羅、難しいのでは
Avoid unless you are absolutely sure of what you are doing ← わかる
Doubly robust
リタゲ広告の効果測定の例に因果グラフ使うのいいなー
Causal CTRよくわからなかった
Natural Experiments
ロンドンのコレラ大発生の例
Assassin's creed syndicateの時代
Contaminated Water が原因でコレラになるのか、コレラが原因でContaminated Waterになるのか
因果の方向がわからない
水道会社をInstrument Variables (操作変数)とする
コレラの発生 → 水道会社の選択 の因果は無いと仮定
as-if randomの仮定を信じる理由があれば因果効果の推定ができる
ただし見つけるのが難しい
Instrumental Variables
Y→Tの逆の因果がありそうな時に使う
Shock
Causal CTR
App1のリコメンドシステムのクリックによるApp2への遷移、リコメンドが無くても起きてた?
App2へのオーガニック流入は一定
ある時App1への流入が激増した(Shock)
App2への流入が激増したら causal effect とみなせる
Regression Discontinuities
傾きが非連続に変化したか
NETWORK EFFECT
サブネットワークを使う、影響しあう
References
1. Pearl, Judea. "Theoretical impediments to machine learning with seven sparks from the causal revolution." arXiv preprint arXiv:1801.04016 (2018).