効果検証入門
https://gyazo.com/8e2af7873040cc010da23b301b6c85be
因果の問題を
欠損値としてとらえた Donald Rubin のアプローチ ← この本はこっち
ベイジアンネットワークを出発点に考えた Judea Pearl のアプローチ
こっちは DAG とか
潜在的な購買量 = 何もしなかった場合に起きる売上
メール配信ありとなしの比較、そもそも買いそう(=効果が見込めそう)な顧客に配信していて、(潜在的な購買量 + メールの効果) を効果と思ってしまう話
グループの潜在的な購買料に差がある → セレクションバイアス
因果推論の根本問題: 同じサンプルからはどちらか一方の結果しか観測できない
RCT(Randomized Controlled Trial)
完全に無作為に介入して比較する
母集団の性質を推定する
ポテンシャルアウトカムフレームワーク
介入
$ Z_i = \begin{cases} 1&(介入した場合)\\ 0&(介入しなかった場合) \end{cases}
効果
$ Y_i = \begin{cases} Y_i^{(1)}&(Z_i=1) ... 介入した場合の効果 \\ Y_i^{(0)}&(Z_i=0) ... 介入しなかった場合の効果 \end{cases}
$ Y_i = Y_i^{(0)}(1-Z_i)+Y_i^{(1)}Z_i
メール配信の効果は、介入の有無の期待値の差
$ \tau = E[Y^{(1)}] - E[Y^{(0)}]
ATE(Average Treatment Effect) = 平均処置効果
介入を受けたサンプルとそうでないサンプルの平均の差は、セレクションバイアスが入る
条件付き期待値の差になっている
$ \tau_{naive} = E[Y^{(1)}|Z=1] - E[Y^{(0)}|Z=0] を展開していって
$ \tau_{naive} = \tau + E[Y^{(0)}|Z=1] - E[Y^{(0)}|Z=0] になることが示される
https://gyazo.com/86886afc321cb432c9ad1948fdd15d53
介入が $ Y^{(0)} が高いと思われるサンプルに割り振られやすい状態では、介入の効果がいつも過剰に評価される
RCT の場合
$ E[Y^{(0)}|Z=1] = E[Y^{(0)}|Z=0] とみなせる
有意差検定