P値
統計で検定を行う。得られたサンプルからある検定統計量を計算する。 元の集団に対してある分布を仮定(パラメータも含め)して、その検定統計量の値を含めて、それ以上に極端な値が得られる確率を出す。
それがp値。 値が小さければ、その仮定は棄却され、反対仮説を採用する。肯定は難しいけど否定は矛盾する状況?が一個あればよい。
p値が一様分布
パラメトリック統計学における仮説検定は、尤度比が最小十分統計量となるので、これに沿って理論的枠組みが与えられる。
尤度 。あるサンプルデータがある。 このモデルでこのパラメータをこれにとすると(仮定)、この結果になるのはこのぐらい。 1つ1つのデータポイント?について、このぐらい、を出して、それぞれが独立したと仮定するから、 'このぐらい'の掛け算になる。よって、非常に小さな数値になるので、対数を取った計算にすることが多い。LogL
この尤度が一番大きいところで、モデル、パラメータを確定するのが、最尤法。
最尤法は、使ったデータに対してオーバーフィットだろうとして、AICとか、機械学習の識別方なら交差検証とか。