2元配置モデル
観測値に影響を与える要因が2つある分散分析のモデルを 2元配置 とよぶ。
2つの要因 $ A, B
$ Aの水準数 $ J, $ Bの水準数$ K
各水準組み合わせ$ (A_j, B_k)につき$ r個の観測値$ y_{ijk} (i=1, 2, ..., r)が得られるとする。
この時、以下が成り立つとする。
$ y_{ijk} = \mu_{jk}+\epsilon_{ijk}
$ \epsilon_{ijk} \sim N(0, \sigma^2)
すると、モデルは以下のように書ける。
$ y_{ijk} \sim N(\mu_{jk}, \sigma^2)
また、各水準組み合わせ$ A_j, B_kにつき、
$ \bar{y}_{jk} = \frac{1}{r}\sum_{i=1}^ry_{ijk}
とおくと、以下が成り立つ。
$ \bar{y}_{jk} \sim N(\mu_{jk}, \sigma^2/r)
母平均$ \mu_{jk}を全体平均と要因の効果に分解する。
$ \mu = \frac{1}{JK}\sum_{i=1}^{J}\sum_{k=1}^K\mu_{jk}
この量を全体平均とよぶ。また、行平均$ \mu_{j.}と列平均$ \mu_{.k}を以下のように定義する。
$ \mu_{j.} = \frac{1}{K}\sum_{k=1}^K\mu_{jk}
$ \mu_{.k}=\frac{1}{J}\sum_{j=1}^J\mu_{jk}
要因$ Aの第$ j水準の効果、要因$ Bの第$ k水準の効果をそれぞれ主効果とよび、
$ \alpha_j = \mu_{j.}- \mu
$ \beta_k = \mu_{.k}-\mu
で定義する。
この時、次の恒等式が成り立つ
$ \tag{1} \mu_{jk} = \mu + \alpha_j + \beta_k + (\mu_{jk}-\mu_{j.}-\mu_{.k}+\mu)
この右辺の最後の項は、要因$ Aの効果と要因$ Bの効果では説明できない効果であり、水準組合せ$ (A_j, B_k)に固有な効果と解釈ができる。
これを 交互作用効果とよび、$ (\alpha\beta)_{jk}と書く。すなわち、
$ (\alpha\beta)_{jk} = \mu_{jk}-\mu_{j.}-\mu_{.k}+\mu
であり、(1) は次のように書くことができる。
$ \mu_{jk} = \mu + \alpha_j + \beta_k + (\alpha\beta)_{jk}
この構造を仮定したモデルを2元配置分散分析モデルという。
参考:入門統計解析 p315