P値
統計で検定を行う。得られたサンプルからある検定統計量を計算する。
元の集団に対してある分布を仮定(パラメータも含め)して、その検定統計量の値を含めて、それ以上に極端な値が得られる確率を出す。
それがp値。 値が小さければ、その仮定は棄却され、反対仮説を採用する。肯定は難しいけど否定は矛盾する状況?が一個あればよい。
p値が一様分布
帰無仮説のもとでp値の分布が一様分布になることの証明 - kivantium活動日記
確率変数としてのp-valueの感覚をRで身につける - micro*macro
#TODO201908 なんとか理解したい。確率変数だという感覚は、、そうなるように意識しておく。
検定統計量 - Wikipedia
パラメトリック統計学における仮説検定は、尤度比が最小十分統計量となるので、これに沿って理論的枠組みが与えられる。
尤度 。あるサンプルデータがある。 このモデルでこのパラメータをこれにとすると(仮定)、この結果になるのはこのぐらい。
1つ1つのデータポイント?について、このぐらい、を出して、それぞれが独立したと仮定するから、 'このぐらい'の掛け算になる。よって、非常に小さな数値になるので、対数を取った計算にすることが多い。LogL
この尤度が一番大きいところで、モデル、パラメータを確定するのが、最尤法。
最尤法は、使ったデータに対してオーバーフィットだろうとして、AICとか、機械学習の識別方なら交差検証とか。
あとでこのあたりも勉強する。 #wip
データ解析のための統計モデリング入門 GLMの尤度比検定と検定の非対称性 - Qiita
#statistics #math