符号検定
母集団の中央値が、ある値と等しいかどうかを比較する
検定力は低い
帰無仮説を棄却しづらい
棄却できる場合も、わざわざ検定をせずともデータの見た目で判断できることが多い
$ H_0: \mu=\mu_0
$ \muは母集団の中央値
$ \mu_0はある決まった値
この帰無仮説を見ても符号検定って実用的なのか?って感じがするなmrsekut.icon
$ \mu_0は決め打ちで、「中央値はここか!?」を検定する
$ H_1: 2変数間に差がある、と仮定する
検定方式
$ nが20とかより大きい場合は、以下の式を使う
$ u_0=\frac{u-\frac{n}{2}}{\sqrt{\frac{n}{4}}}
$ uは標本の中で$ \mu_0より小さいものの個数
$ nは標本数だが、$ \mu_0に等しいものは除く
判定
$ H_1: $ \mu\lt\mu_0のとき、$ u_0\ge z(\alpha)なら$ H_0を棄却する
$ H_1: $ \mu\gt\mu_0のとき、$ u_0\ge -z(\alpha)なら$ H_0を棄却する
$ H_1: $ \mu\ne\mu_0のとき、$ |u_0|\ge z(\frac{\alpha}{2})なら$ H_0を棄却する
具体例
とある地域のいくつかの美術館の入館者数について考える
入館者数の中央値は40000人であるか
40000人より少ないと思うので以下のような帰無仮説を設定する
$ H_0: 中央値$ \mu=40000
$ H_1: $ \mu\ne4000
実際に調べたらその地域には100館あり、そのうち70館は40000人未満であり、30館が40000人より多かった
$ u_0=\frac{70-\frac{100}{2}}{\sqrt{\frac{100}{4}}}=4
正規分布より$ z(0.01)=2.3263なので、$ u_0\gt 2.3263より$ H_0は棄却
よって、来館者数は40000人より少ない
参考