仮説検定
en: hypothesis test, statistical hypothesis test, statistical hypothesis testing
aka. 統計的仮説検定
要点
ベイズ統計なら fool proof らしい。
手順
効果量(effect size)標準偏差とを仮定しておく。
有意水準と検出力とを それぞれ決めておく。
最小限 必要な sample size が導出できる。
def.
仮説
仮説とは母集団のパラメタに関する命題である。
H₀: 帰無仮説 (en: null hypothesis)
H₁: 対立仮説 (en: alternative hypothesis)
rejection region R
ja: 棄却域
aka. critical region
def. R ⊂ sample space S: reject H₀ (null hypothesis)
def. acceptance region $ R^∁ = ∁ (complement) of rejection region R
ref. Casella, Berger (2002) Statistical Inference (§8.1, p. 374)
二分法
パラメーター
parametric test
nonparametric test
具体例
T検定
(2値)仮説検定の用語
power
ja: 検出力
⊂ probability
つまり確率の一種
モデル
parametric な統計モデルのこと
錯誤
en: error
2 types:
第一種の誤り
en: type 1 error
aka. false positive
確率 = α
第二種の誤り
en: type 2 error
aka. false negative
確率 = β
fig.
H0 vs H1 / type-1 vs type-2 error
例の trade-off の図
ROC curves¦Wikicommons
https://upload.wikimedia.org/wikipedia/commons/4/4f/ROC_curves.svg
Type I and Type II errors in Testing of Hypothesis | by DrVishnu Srivastava | Medium
https://miro.medium.com/v2/resize:fit:4800/format:webp/1*jCz3bLzHdvSKvNMJwVCBdw.jpeg
片側検定
The value of the p-value. Why “p-value<0.05” isn’t enough | by Santiago Rodrigues Manica | Epidence | Medium
https://miro.medium.com/v2/resize:fit:1400/1*3lb1IYNqrVutD9mEqQzyqQ.png
両側検定
https://gyazo.com/5e269a738f6575bb9cebc8675fa40d4c
図 10.2 統計的仮説検定のフレームワーク
整理
これは古典統計の頻度論的なフレームワークのはず?
つまり プロセスが大事な はず。
NHST
abbr. Null-Hypothesis-Significance Testing statistics
現行の手法らしい。
簡易版?
ネイマンでもピアソンでもフィッシャーでもないらしい?
ref. ベイズ統計学と再現性の危機(テンプル大学統計科学部助教授:マクリン謙一郎) #心理統計を探検する|「こころ」のための専門メディア 金子書房
cf. QRPs
課題
検定の選択
cf. モデル選択
多重検定の問題
e.g. HARKing
⊂ QRPs
選択停止の問題
p値と有意水準が変わってしまう。操作の余地がある。
ref.
仮説検定 - Wikipedia
https://ja.wikipedia.org/wiki/仮説検定#棄却域
統計的仮説検定 | 有意に無意味な話
Hypothesis Testing - Statistics How To
rejection region
Rejection Region Definition Statistics How To
Rejection Region - an overview | ScienceDirect Topics
Statistical hypothesis testing - Wikipedia
A comparison between Fisherian, frequentist (Neyman–Pearson)
table
受信者操作特性 - Wikipedia
https://upload.wikimedia.org/wikipedia/commons/e/ed/Distributions_of_the_Observed_signal_strength_v2.svg
https://doi.org/10.12688%2Ff1000research.6963.3
NHSTで問題になってベイズ で問題にならないとはどういうことなのか調べる
学習メモとリンク集
書籍
丹後俊郎 2018『新版 統計学のセンス』