プールした分散
when the mean of each population may be different, but one may assume that the variance of each population is the same.
母集団の平均パラメータは違うが、分散パラメータは同じと想定できる状況で使う。
分散同じなので、poolすれば、精度を上げられる。t検定とかを使う平均値の差の検定などに。 プールした(全体としてのサンプルの)標本分散は、按分して出す。
$ \hat{\sigma}_{pooled}^2 = \frac{(n_1-1)\hat{\sigma}_1^2 + (n_2-1)\hat{\sigma_2^2}}{(n_1-1) + (n_2-1)}
$ \sqrt{ \frac{\sigma_{pooled}^2}{n_1} + \frac{\sigma_{pooled}^2}{n_2}}
2つのサンプルからを1つにプールして分散を考える
サンプルごとの 不偏分散をそのまま足して、、違う値を使うことで、同一性の検定にならない? (サンプルサイズ-1)の加重平均で作るプールした分散を作る。
ここから、再度、2つに分けて? それぞれのサンプル数で割って、誤差分散を出す。
足して、二乗根を取って、2つのサンプルの平均の差をサンプルとした標準誤差とする。t検定に行く。
サンプルサイズが同じだったら、それぞれの誤差分散を足して二乗根で割っても大丈夫。違うと上記のように面倒。
分散が同一というテストをして、平均値の差の効果量のテストをするという2回検定(多重検定)
平均値の区間推定での利用。
サンプルが2つあって、その平均値の差の区間推定をしたい。
平均値の差の不偏推定量は、$ \bar{X_1} - \bar{X_2} で良い。 誤差(standard error)の方は、誤差分散(二乗根を取る前の)を足せば良い。 検定の場合は、同じ分布からのもの(元の分布分散同一)という仮定を置くので。