カイ二乗検定
適合度検定、ともいう
複数のグループの割合が、想定したものになっているかどうかを検定する
独立性の検定とも見れる
2つの変数に関連があるのかどうかを判断する
$ k個のグループについて、
$ H_0: 分類$ jの割合は$ e_jである.
$ (j=1,2,\cdots,k)
$ H_1: $ H_0の否定
検定方式
$ \chi^2=\sum^k_{j=1}\frac{(O_j-E_j)^2}{E_j}
$ O_jは分類$ jの観測度数
$ E_j=ne_jは分類$ jにおける期待度数
観測と期待の一致度合いが高ければ、$ \chi^2は小さくなる
一般には$ \nu=k-1
理論分布が観測データから推定される$ m個のパラメータを含む場合は$ \nu=k-m-1
$ \chi^2\ge\chi^2_\nu(\alpha)なら$ H_0を棄却
現実的な例
1時間の家にどこで不良品が出たかを調べた結果
スーパーマーケットで客がどのレジを選ぶか
消費者が何種類かの銘柄のうちのどのビールを選ぶか
具体例
table:血液型
A B O AB
38 22 30 10
80人のデータを取ったら、(A,B,O,AB)=(30,18,27,5)人であった。
上の表の度合いになっているかを検定する。
$ H_0: 割合が上の表のようになっている
$ H_1: $ H_0の否定
期待度数は
$ 80\times0.38=30.4
$ 80\times0.22=19.6
$ 80\times0.3=24.0
$ 80\times0.1=8.0
$ \chi^2=\frac{(30-30.4)^2}{30.4}+\cdots=1.514\lt\chi^2_3(0.05)=7.815
よって、有意水準5%で$ H_0は棄却されない
上の表のような割合になっていることは否定できない
参考