極値分布
極値極限分布
極値統計量$ Z_nについて,定数列$ a_n, b_nを用いて
$ \frac{Z_n-b_n}{a_n} \xrightarrow{d} Z
と基準化を行う($ dは分布収束).
このとき,
$ P(\frac{Z_n-b_n}{a_n} \leq x) \to P(Z \leq x) = G(x)
を考える.
$ P(\frac{Z_n-b_n}{a_n} \leq x) = P(Z_n \leq a_nx+b_n) := F^n(a_nx+b_n)
より,
$ F^n(a_nx+b_n) \to G(x)
である.
このとき$ G(x)を極値分布と呼ぶ.
また,$ Fを極値分布$ Gの吸引領域に属すると言う.
また$ (a_n, b_n)を基準化定数と言う.
極値統計量が従う分布が$ F,それを基準化した統計量が従う分布$ Gを極値分布と呼ぶ?asRagi.icon
$ Gにされる$ Fの集合を吸引領域と呼ぶ?asRagi.icon
また,$ a_nx+b_n = yとおくと,
$ P(Z_n \leq y) = F^n(y) \sim G(x) = G(\frac{y-b_n}{a_n})
より,極値統計量$ Z_nの分布は$ G(\frac{y-b_n}{a_n})の極値分布で近似できる.
3つのタイプの極値分布が存在する(ref. 分布のタイプ).
Gumbel分布
Frechet分布
Weibull分布
$ n=10くらいで収束する.
上記の3つのタイプの極値分布を1つの式で表したのが一般極値分布である.
非退化な分布$ Gが極値分布となるための必要十分条件は,
$ \forall n \in \mathbb{N}, \exists a_n, b_n
$ G^n(a_nx+b_n) = G(x), \forall x \in \mathbb{R}
である(最大値安定性).これより,極値分布$ Gは$ Gの吸引領域に属していると言える.