帰無仮説
仮説検定とは?初心者にもわかりやすく解説!
2016/08/23 2019/01/16 仮説検定 IMIN
仮説検定(hypothesis testing)とは、「とある仮説に対して、それが正しいのか否かを統計学的に検証する」という推計統計学の手法の一つです。また、統計的仮説検定、もしくは省略して単に検定と呼ぶこともあります。
今回はわかりやすい例を交えつつ、解説していきます。このページは初心者でもわかるよう作りましたので、初めての方も安心してお読みください!
まずは仮説検定がどのような場面で使えるのか、その具体例を見ていきましょう。
例
ここに、”自称”予知能力のある占い師がいた。その能力が本物かを検証すべく、野球の試合の勝ち負け予想をさせたところ、5試合連続で予想を的中させた。さて、ここで占い師の予知能力は本物であると言えるのか?(※なお試合の勝率は常に12とする)
この問に対して、「5試合も連続で当てたのだから本物だろ」って答える人もいれば、「いやいや、たかだが5試合じゃ分からない。6試合目で間違うかも知れないぞ」と言う人もいることでしょう。意見が割れそうなところですよね。
これを統計学を用いて客観的に判断するのが、仮説検定と呼ばれる手法です。まず、仮説(H0と名付ける)として
H0:この占い師には予知能力などない。
というのを立てます。この仮説が間違っていると説明できれば、
H1:この占い師には予知能力がある。
ということになります。(このときの状態はH1と名付ける)
では、いよいよ仮説検定という手法を使ってこのH0が正しいかについての検証をしていきます。さて、そもそも、予知能力なしで5連続で勝つチームを当てる確率は、
(12)5=132=0.03125
により、3.125%となります。もし、占い師に予知能力がなかったらこの約3%の確率の「当てずっぽう」に成功したと言えます。有り得ないというほどではありませんが、非常に低い確率ですよね。
私が「それは、とても低い確率だから仮説H0は間違ってるだろう」考えることで、仮説H1が正しいことになり、占い師の予知能力が認められます。
しかし、ここで問題が発生します。私は、仮説H0が間違っていると勝手に判断しましたが、それが正しい確率だって3.125%あるわけです。
果たして私の主観で、「正しい確率がたった3%だから間違ってる!」と勝手に決めてしまってもいいのでしょうか。
もちろんダメです。統計的仮説検定では、この判断基準を有意水準αと名付け、計算をする前に決めておきます。通常、5%や1%(α=0.05やa=0.01)を使います。今回の場合、有意水準が5%であれば、H0は間違っていると判断できます。しかし有意水準が1%であったら、H0は間違っているとは言えません。
ここで用語について説明を加えさせていただきます。
まず、二つの仮説、H0、H1をそれぞれ帰無仮説(きむかせつ)、対立仮説というような呼び方をします。
また、H0は間違っていると判断することを、H0を棄却(ききゃく)すると言います。さらにH0を棄却したにも関わらず、H0が実は正しかった場合を「第一種の過誤」と呼びます。そして、仮説検定における第一種の過誤の確率は有意水準αの値に一致します。
さて、「第一種の過誤」があるのならば、「第二種の過誤」もまたあります。それはH1が実は正しかったのにも関わらず、H0を棄却しないことを指します。
また、今回の場合の帰無仮説が正しいとしたときに、今回の占いの結果が得られる確率0.03125をp値(p value)という呼びます。p値とは、「帰無仮説が正しいとしたときに、観測データの実現値が得られる確率、またはそれ以上に極端なデータが得られる確率」と定義されます。帰無仮説を棄却する条件は、p値が有意水準より小さいことです。
耳なれない言葉がたくさん登場して混乱するところかと思いますが、非常に大切な言葉達なので、是非覚えておいてください。表にまとめておきます。
誤りの関係性
帰無仮説の決め方~どちらを帰無仮説にしても良いのか~
ところで、先ほどの例では帰無仮説を「この占い師には予知能力などない。」と設定しましたが、反対に「予知能力がある」の方を帰無仮説に設定してもいいのでしょうか?
答えは、ダメです。「予知能力がない」方を帰無仮説にしたのには理由があります。
仮説検定では、主張したい仮説ではない方の仮説を帰無仮説とします。この場合、予知能力の存在について主張したいので、予知能力がないことを帰無仮説に置かなくてはいけないのです。文字通り、帰無仮説とは無に帰する仮説になります。
仮説検定では、この帰無仮説の棄却をし、主張したいことの正しさの証明を目指します。ですので、主張したいことは、対立仮説においておきましょう!
有意水準が5%や1%を用いる理由
有意水準は通常5%や1%を用いると前述しましたが、なぜこのような値を使うのでしょうか。その答えは、5%や1%で起きる事は滅多に起きない、非常に珍しい事と言えるからです。
そもそも、帰無仮説を棄却することと、棄却しないことの重みは違います。
”帰無仮説を棄却しない=帰無仮説を受容する” ではない!
帰無仮説を棄却 ⇒ 帰無仮説は違う。対立仮説を採用、となります。 棄却する場合
帰無仮説を棄却しない ⇒ 帰無仮説が正しい、とはならない!
棄却しない場合
この場合は、あくまでも証拠不十分により棄却できなかったに過ぎません。また、新たな根拠を探して、帰無仮説の棄却を目指すことだって出来ます。
つまり、棄却というのは、簡単にするべきではないのです。一度棄却してしまったら、その仮説を再び考えることはしません。だから慎重に棄却します。そのため、有意水準は5%や1%と低くなくてはならないということです。
また、1%で行った仮説検定のほうが、5%で行った仮説検定よりも正確率の高いものになります。
ところでこの仮説検定、私たちの生活ではどのように役立っているのでしょうか。
仮説検定は新薬開発の現場で使われている.
仮説検定が実務で使われている場面として、新薬の開発が挙げられます。例えば、新しいかぜ薬が開発段階にあったとします。その効き目について検証したい場合、
帰無仮説:新しい風邪薬には効き目がない。
対立仮説:新しい風邪薬には効き目がある。
というようにして、仮説検定を行います。この検定で、一定の有意水準を満たした薬のみが、新薬として世に出回ります。また、新薬に限らず、既存の薬を改良する場合でも
帰無仮説:改良後の薬の効き目と従来の薬の効き目に差は見られない。
対立仮説:改良後の薬の方が従来の薬より効き目が良い。
として、仮説検定によって薬の効き目を確かめます。
私たちが飲む薬の効き目が、ある程度保証されているのも、実は仮説検定による基準が設けられているからなのです。製薬会社には、統計解析職というものが存在するのもこのためです。
仮説検定のおおまかな手順
最後に、仮説検定の手順についてもう一度おさらいしておきます。
手順①:検証したいことについて2つの仮説、帰無仮説と対立仮説を立てます。このとき、主張したい説の方を対立仮説とします。
手順②:帰無仮説が正しいとしたときに、その観測データの実現値が得られる、もしくはそれよりもさらに極端なデータが得られる確率(p値)を求めます。
手順③:手順②で計算したp値が有意水準以下の場合、帰無仮説を棄却し、対立仮説を採択します。そうでない場合、帰無仮説は棄却出来ず、検定は失敗に終わります。
まとめ
仮説検定について、いかがでしたでしょうか。耳慣れない言葉が数多く登場したかと思いますが、どれもよく使うものなので覚えておきましょう。
仮説検定とは?初心者にもわかりやすく解説!