p値
新しく作ったシステムのユーザ評価を行なうとき、結果がどの程度信頼できるのかを示す指標としてp値がよく利用されています。
Wikipediaでは以下のように記述されています。(2017/8)
帰無仮説の下で実際にデータから計算された統計量よりも極端な(仮説に反する)統計量が観測される確率を、p値という。
帰無仮説(null hypothesis)とは「効果や違いが無い」という仮説で、これが否定されれば「効果があった」と判断できます。
たとえばイカサマコインの判定は以下のように行ないます。
コインの裏表が対称だという帰無仮説をたてる
コインを10回投げたら全部表だったとする
偶然そうなる確率は $ 1 / 2^{10} = 0.001
p値=0.001 で最初の仮説が棄却される
つまりコインは対称でなかったと判定される
/icons/水平線.icon
帰無仮説の下で実際にデータから計算された統計量よりも極端な統計量が観測される確率を、p値という。
統計用語。ある実験中に群間差が偶然生じる可能性を示す尺度。例えば、p値が0.01(p=0.01)というのは、この結果を偶然生じることが100回に1回あることを意味する。p値が小さくなるほど、それだけ群間差は治療により生じている可能性が高くなる。
The p value and the base rate fallacy
上の記事の翻訳
base rate = 基準率
何度も比較を行えば、本当は存在しない現象が存在するかのように判断されてしまう可能性がある。
奥村氏記事
https://gyazo.com/827edce3766ed2026086631854085457.png
P値に関する誤解
【翻訳】ダメな統計学 (5) p値と基準率の誤り
p値(有意確率)と有意水準を具体例から解説!有意水準を設定するタイミングについて
Statisticians issue warning over misuse of P values
Nature記事
検定力が低い実験を何度もやると良いp値が出てしまう?
帰無仮説が成り立っているという条件のもとで、ある統計的な事象が発生する確率
($ Hが帰無仮説, $ xが統計量とする)
$ P(X = x | H)
この確率(p値)が低いということは、最初の条件(仮説)が成り立っている確率も低いわけだから、仮説が成り立っていないものとしてよい(=帰無仮説を棄却してよい)、ということ
https://xkcd.com/882/ https://imgs.xkcd.com/comics/significant.png
#帰無仮説 #確率