指数分布 - star_field public

指数分布

from 幾何分布

幾何分布#69b2c20400000000004e98dfで時間の単位を変えて、

待ち時間を確率変数X時間とすると、

$ P(X\leq x)=1-2^{-x}

が成立するといえる。

1時間をn等分して離散化するとき、nを大きくしていった極限を考えれば、Xが取りうる値は連続的に存在している。

一般に、適当な条件を持つ現象の待ち時間をXとすると、

適当な条件とは？hoshihara.icon

正のパラメータ$ \lambdaを使って

$ P(X\leq x)=1-\exp(-\lambda x)=:\mathrm{Exp}(\lambda)

と書ける。

説明もなく自然対数の底が出てきた。hoshihara.icon

$ 2=e^\lambdaとなる$ \lambdaを考えれば、

\lambda=\log2

さっきの式の2をe^λで置き換えたのがexp(λ)だからそんな計算はいらん。

$ P(X\leq x)=1-2^{-x}となる

確率変数Xが$ \mathrm{Exp}(\lambda)で表される確率分布に従うとき、

Xはパラメータλの指数分布(exponential distribution)に従うといい、

これを$ X\sim \mathrm{Exp}(\lambda)で表す。

一般に、

$ F(x)=P(X\leq x)のとき、

FをXの累積分布関数という。

指数分布の図示

幾何分布の場合には、$ Z\leq zをみたす確率

$ P(Z\leq z)=\sum_{t\leq z}P(Z=t)

が有効であったのに対応して、

そうなの？hoshihara.icon

離散だから足し算してた

指数分布の場合にも、$ X\leq xをみたす確率に注目し、

$ P(X\leq x)=\int_{-\infin}^xf(t)dt

となるようなf(x)を考えることにする。

これなんで負の無限大なんだろうhoshihara.icon

そもそもここでいう指数は0<P<1なので単調減少

一般化して書くためだと思う

x以下の部分の面積がX<=xとなる確率である。

また、$ P(a\leq X\leq b)=\int_a^bf(x)dx

が成立する。

f(x)はX=xとなる確率ではないことに注意。

確率密度という新たな概念である。

このf(x)をXの密度関数という。

#確率密度関数

f(x)が連続であれば、微分積分学の基本定理から、

$ F'(x)=\frac{d}{dx}\int_{-\infin}^{x}f(t)dt=f(x)

なので、累積分布関数の導関数が密度関数fとなる。

指数分布に従うXの累積分布関数は、$ x<0なら$ F(x)=P(X\leq x)=0なので、

$ F(x)\begin{cases}1-\exp(-\lambda x)&&(x\geq 0)\\0&&(x<0)\end{cases}

故障時間の期待値

ある機械の故障は偶発故障が多い

初期故障と摩耗故障の割合は無視できる

x>0に対し、使用開始からx日以内に故障する確率が$ 1-e^{-0.01x}で与えられる

この機械が故障するまでの時間の期待値はいくらか

常に一定の確率で起こる現象の待ち時間は指数分布で表現される

ここではこの機械が故障するまでの時間Tが$ \lambda=0.01の指数分布に従うと仮定している

パラメータλの指数分布の累積分布関数を$ F(x)、密度関数を$ f(x)とする

Tの単位は日だが実数を動く

Tの整数部分をKとし、K日目に故障するとする

すなわちTを離散化し、整数の値を取る確率変数Kを導入する

このときk = 1, 2, ......に対し、k日目に故障する確率は

$ P(K=k)=P(k\leq T< k+1)=F(k+1)-F(k)

よってKの期待値は

$ E(K)=\sum_{k=0}^{\infin}k(F(k+1)-F(k))

この$ E(K)は$ E(T)を近似していると考えられる

そこで、1日をn分割すると、

k = 0, 1, 2, ......に対し、$ P\left(\frac{k}n\leq T<\frac{k+1}{n}\right)=F\left(\frac{k+1}n\right)-F\left(\frac{k}n\right)なので、

累積分布関数の定義から

$ E(T)のより精密な近似値として

$ \sum_{k=0}^\infin\frac{k}{n}\left(F\left(\frac{k+1}n\right)-F\left(\frac{k}n\right)\right)\approx\sum_{k=0}^\infin\frac{k}n f\left(\frac{k}n\right)\frac{1}n

導関数の定義より、$ F'(x)=\lim_{h\rightarrow 0}\frac{F(x+h)-F(x)}{h}

$ \therefore h\cdot F'(x)\approx F(x+h)-F(x)

h = 1/n、x = k/nとすると

$ F\left(\frac{k+1}n\right)-F\left(\frac{k}n\right)\approx f\left(\frac{k}n\right)\frac{1}n

$ f\left(\frac{k}n\right)\frac{1}nの近似の精度はnが大きいほど上がる

$ E(K)=\sum_{k=0}^{\infin}k(F(k+1)-F(k))の式のkをk/nに置き換えたあとに、この近似の式で置き換えている。

さらに、$ \sum_{k=0}^\infin\frac{k}n f\left(\frac{k}n\right)\frac{1}nにおいて$ n\rightarrow \infinとすると、$ \int_0^\infin xf(x)dxとなる

$ \sum_{k=0}^\infin\frac{k}n f\left(\frac{k}n\right)\frac{1}n=\sum_{k=0}^\infin x_kf(x_k)\cdot\Delta x\approx \int_0^\infin xf(x)dx

いやあんまりわかってない

区分求積法

$ x<0のとき$ f(x)=0であるから$ E(T)=\int_{-\infin}^{\infin}x f(x)dxと書き換えてもよい

指数分布#69b3f66f00000000000edcb9と同じことをしている

以上より$ E(T)=\int_{-\infin}^{\infin}x f(x)dx

定義

Xを密度関数fをもつ連続的確率変数とする

$ \int_{-\infin}^{\infin}|x|f(x)dx<\infinのとき、

絶対収束

Xの期待値$ E(X):= \int_{-\infin}^{\infin}xf(x)dx