DID
差分の差分法
Claude Code.icon
DIDが解こうとしている問題
ある施策(例:ある地域だけで打った広告キャンペーン)の効果を測りたい。素朴には2通りの比較が考えられますが、どちらも単独では間違える:
table:_
比較のやり方 何が混ざるか
介入した地域 vs 別の地域(横の比較) 地域固有の差(もともと売上水準が違う等)が混ざる
介入地域の「前 vs 後」(縦の比較) 時間トレンド(季節要因・景気など自然な変化)が混ざる
DIDの発想は、この2つの「邪魔者」を引き算で両方とも消すことです。
仕組み:差を2回とる
「Difference in Differences(差分の差分)」の名前のとおり、引き算を2段階で行います。
ステップ1:各地域で「後 − 前」をとる
介入地域:(介入後 − 介入前) → 中身は「時間トレンド + 施策効果」
非介入地域:(後 − 前) → 中身は「時間トレンドだけ」
このとき、時間で変わらない地域固有の差(水準の違い)が消えます。
ステップ2:その2つの差をさらに引く
code:_
DID効果 = (介入地域の前後差) − (非介入地域の前後差)
= (時間トレンド + 施策効果) − (時間トレンド)
= 施策効果
両地域に共通する時間トレンドが消えて、施策効果だけが残る。
数値の例
table:_
介入前 介入後 前後差
介入地域 100 130 +30
非介入地域 80 95 +15
DID効果 = 30 − 15 = +15。
(単純に介入地域の前後差 +30 を効果と見ると、時間トレンド分 +15 を過大評価してしまう)
命綱になる仮定:平行トレンド仮定(common trend)
DIDが成り立つ前提は1つ。
もし介入地域が施策を受けなかったとしたら、その時間変化は非介入地域の変化と一致していたはずだ
「ステップ2で時間トレンドが消える」と言えるのは、両地域のトレンドが同じだと仮定しているからです。
ここがエッセンスでも強調されている核心ですが——この仮定は観測できない反実仮想(介入地域の"もし介入しなかったら")に対する仮定なので、データだけでは原則検証できない。最後は分析者の解釈に委ねられます。本書全体のメッセージ「4つの手法はどれもデータから検証できない仮定の上に立つ」の一例です。
実務上の注意点
回帰の交互作用項で表現できる:地域ダミー × 期間ダミー の係数がDID効果。共変量を足せば標準誤差を下げられる。
クラスター標準誤差が必要:同じ対象を複数期間追うため誤差が自己相関を持ちやすく、補正しないと標準誤差を過小評価する。
/mrsekut-book-9784274234545/効果検証入門 30分エッセンス