Kolmogorov–Smirnov検定
どんな違いだったとしても、とにかく違ったら帰無仮説が棄却される
つまり、なんで違うのかがわからない
なので、棄却された場合は、分布が異なるのか、代表値が異なるのかを再度検討する必要がある
$ H_0: F(x)=G(x),\forall x
以下の統計量を使う
$ K^{+}=\max _{-\infty<x<+\infty}\left(G_{n}(x)-F_{n}(x)\right)
$ K^{-}=\max _{-\infty<x<+\infty}\left(F_{n}(x)-G_{n}(x)\right)
$ K^{-}=\max _{-\infty<x<+\infty}|F_{n}(x)-G_{n}(x)|
$ C_2(x)を自由度2のカイ二乗分布とすると、以下のような近似が与えられる $ \lim _{n \rightarrow \infty} \operatorname{Pr}\left\{2 n\left(K^{+}\right)^{2} \leq z\right\}=\lim _{n \rightarrow \infty} \operatorname{Pr}\left\{2 n\left(K^{-}\right)^{2} \leq z\right\}=C_{2}(z) \quad(z \geq 0)
$ \lim _{n \rightarrow \infty} \operatorname{Pr}\left\{2 n(K)^{2} \leq z\right\}=C_{2}(z) \quad(z \geq 0)
検定方式($ n\ge 40の場合)
$ H_1:$ F(x)\lt G(x)の時、$ 2n(K^+)^2\ge \chi^2_2(\alpha)なら$ H_0を棄却する
$ H_1:$ F(x)\gt G(x)の時、$ 2n(K^-)^2\ge \chi^2_2(\alpha)なら$ H_0を棄却する
$ H_1:$ F(x)\ne G(x)の時、$ 2n(K)^2\ge \chi^2_2(\alpha)なら$ H_0を棄却する
例
小5と中2で計算問題の誤り率を比較
table:誤り率
小5 39.1 41.2 45.2 46.2 48.4 48.7 55.0 40.6 52.1 47.2
中2 35.2 39.2 40.9 38.1 34.4 29.1 41.8 24.3 32.4 32.6
$ H_0: 小5の誤り率$ G(x)=中2の誤り率$ F(x)
$ H_1:$ G(x)\lt F(x)
table:分布
<=27 <=31 <=35 <=39 <=43 <=47 <=51 51<
Fn(x) 1/10 2/10 5/10 7/10 1 1 1 1
Gn(x) 0 0 0 0 3/10 5/10 8/10 1
Fn(x)-Gn(x) 1/10 2/10 5/10 7/10 7/10 5/10 2/10 0
$ F_n(x)-G_n(x)がmaxなのは$ \frac{7}{10}なので$ K^-=\frac{7}{10}
$ {KS}^+(10,0.05)=6を使うと数表より有意水準5%で$ H_0は棄却される
よって、中2の誤り率は小5より低いと判断される