指数分布
待ち時間を確率変数X時間とすると、
$ P(X\leq x)=1-2^{-x}
が成立するといえる。
1時間をn等分して離散化するとき、nを大きくしていった極限を考えれば、Xが取りうる値は連続的に存在している。
一般に、適当な条件を持つ現象の待ち時間をXとすると、
適当な条件とは?hoshihara.icon
正のパラメータ$ \lambdaを使って
$ P(X\leq x)=1-\exp(-\lambda x)=:\mathrm{Exp}(\lambda)
と書ける。
説明もなく自然対数の底が出てきた。hoshihara.icon
$ 2=e^\lambdaとなる$ \lambdaを考えれば、
\lambda=\log2
さっきの式の2をe^λで置き換えたのがexp(λ)だからそんな計算はいらん。
$ P(X\leq x)=1-2^{-x}となる
確率変数Xが$ \mathrm{Exp}(\lambda)で表される確率分布に従うとき、
Xはパラメータλの指数分布(exponential distribution)に従うといい、 これを$ X\sim \mathrm{Exp}(\lambda)で表す。
一般に、
$ F(x)=P(X\leq x)のとき、
指数分布の図示
幾何分布の場合には、$ Z\leq zをみたす確率
$ P(Z\leq z)=\sum_{t\leq z}P(Z=t)
が有効であったのに対応して、
そうなの?hoshihara.icon
離散だから足し算してた
指数分布の場合にも、$ X\leq xをみたす確率に注目し、
$ P(X\leq x)=\int_{-\infin}^xf(t)dt
となるようなf(x)を考えることにする。
これなんで負の無限大なんだろうhoshihara.icon
そもそもここでいう指数は0<P<1なので単調減少
一般化して書くためだと思う
x以下の部分の面積がX<=xとなる確率である。
また、$ P(a\leq X\leq b)=\int_a^bf(x)dx
が成立する。
f(x)はX=xとなる確率ではないことに注意。
$ F'(x)=\frac{d}{dx}\int_{-\infin}^{x}f(t)dt=f(x)
なので、累積分布関数の導関数が密度関数fとなる。
指数分布に従うXの累積分布関数は、$ x<0なら$ F(x)=P(X\leq x)=0なので、
$ F(x)\begin{cases}1-\exp(-\lambda x)&&(x\geq 0)\\0&&(x<0)\end{cases}
故障時間の期待値
ある機械の故障は偶発故障が多い
初期故障と摩耗故障の割合は無視できる
x>0に対し、使用開始からx日以内に故障する確率が$ 1-e^{-0.01x}で与えられる
この機械が故障するまでの時間の期待値はいくらか
常に一定の確率で起こる現象の待ち時間は指数分布で表現される ここではこの機械が故障するまでの時間Tが$ \lambda=0.01の指数分布に従うと仮定している
Tの単位は日だが実数を動く
Tの整数部分をKとし、K日目に故障するとする
すなわちTを離散化し、整数の値を取る確率変数Kを導入する
このときk = 1, 2, ......に対し、k日目に故障する確率は
$ P(K=k)=P(k\leq T< k+1)=F(k+1)-F(k)
よってKの期待値は
$ E(K)=\sum_{k=0}^{\infin}k(F(k+1)-F(k))
この$ E(K)は$ E(T)を近似していると考えられる
そこで、1日をn分割すると、
k = 0, 1, 2, ......に対し、$ P\left(\frac{k}n\leq T<\frac{k+1}{n}\right)=F\left(\frac{k+1}n\right)-F\left(\frac{k}n\right)なので、
累積分布関数の定義から
$ E(T)のより精密な近似値として
$ \sum_{k=0}^\infin\frac{k}{n}\left(F\left(\frac{k+1}n\right)-F\left(\frac{k}n\right)\right)\approx\sum_{k=0}^\infin\frac{k}n f\left(\frac{k}n\right)\frac{1}n
導関数の定義より、$ F'(x)=\lim_{h\rightarrow 0}\frac{F(x+h)-F(x)}{h} $ \therefore h\cdot F'(x)\approx F(x+h)-F(x)
h = 1/n、x = k/nとすると
$ F\left(\frac{k+1}n\right)-F\left(\frac{k}n\right)\approx f\left(\frac{k}n\right)\frac{1}n
$ f\left(\frac{k}n\right)\frac{1}nの近似の精度はnが大きいほど上がる
$ E(K)=\sum_{k=0}^{\infin}k(F(k+1)-F(k))の式のkをk/nに置き換えたあとに、この近似の式で置き換えている。
さらに、$ \sum_{k=0}^\infin\frac{k}n f\left(\frac{k}n\right)\frac{1}nにおいて$ n\rightarrow \infinとすると、$ \int_0^\infin xf(x)dxとなる
$ \sum_{k=0}^\infin\frac{k}n f\left(\frac{k}n\right)\frac{1}n=\sum_{k=0}^\infin x_kf(x_k)\cdot\Delta x\approx \int_0^\infin xf(x)dx
いやあんまりわかってない
$ x<0のとき$ f(x)=0であるから$ E(T)=\int_{-\infin}^{\infin}x f(x)dxと書き換えてもよい
以上より$ E(T)=\int_{-\infin}^{\infin}x f(x)dx
定義
$ \int_{-\infin}^{\infin}|x|f(x)dx<\infinのとき、
Xの期待値$ E(X):= \int_{-\infin}^{\infin}xf(x)dx