指数分布
$ \lambda{exp}^{-{\lambda}x}
積分すると、$ {exp}^{-{\lambda}x}
と、指数なので、積分しても指数項?の部分は変わらない。係数部分? lambdaは落ちる。
なので、定積分で、0からxまでの確率、時刻(x)までに起きる確率は、$ {exp}^{-{\lambda}x} xが定まったとして。
1/2になるのは? ln(1/2)
0.6931. 0.7くらい。lambdaとxを掛けて (-1)*0.7になるイメージ。
lambdaは期待値になるので、期待値の0.7掛けまで(で良いとも言える)待てば、半分の確率で期待したものが起こる。
ここに、直感とのズレが生じる?
ある時刻tで発生する確率 $ P(X=t)は、
それまでの時間に事が置きなかった確率 に、その瞬間に起きる確率を掛けたもの。 無記憶性 ある時刻tまでに発生する確率 $ P(X<t) = \int_{0}^{t}\lambda{exp}^{{-\lambda}x}dx
期待値5分の待ち時間の指数分布を乱数発生させる
code: expovariate.py
import random
import matplotlib.pyplot as plt
plt.hist(x, bins=100, density=True)
plt.title("exponential distribution")
plt.show()
https://gyazo.com/555af92270bf8986aa13a3f7a5402a6c
なんとなく(癖で?)、正規分布をイメージしてしまうけど、待ち時間のような現象?は指数分布
$ \frac{1}{5}\exp{\frac{-t}{5}}
t=5分で、1/5. 累積分布で、 0からtまでの定積分で、1-exp(-t/5) になって、t=5で、(e-1)/eで、0.63...
lambdaまでに発生する確率は、だいたい0.63くらい。
plt.hist(x, bins=100, density=True, cumulative=True)
https://gyazo.com/f5458282d9e45e8ed6da670e934af1c2
20分ぐらいまでは... 通常ありえる
----------------------------------
ポアソン分布は非常に大きなn回でlambda回成功する場合にn回試行して成功する確率。二項分布(n,p)でnp=lambdaとしてる。
指数分布は、1単位時間をn個に分割して、(t -x)時間まで試行して外し続けて、次のx時間でヒットする。
$ \lim_{n-\inf}(1 - \frac{\lambda}{n})^{n(t-x)} = exp(-\lambda (t-x))外し続けるのはこれで良い。
残りのlamba成功の確率に関する部分のようだけど、x時間, xn回で一回引ければよいので,,,これではだめか。
以下、まだ理解できず。式自体は追えるが、、というか、
$ P(x) = \lambda exp(-\lambda x)
以下のblogを読んでなぞった。
以上の思考過程を経ずにこのグラフをイメージするのは難しいのではないでしょうか。というのも、f(x)がx=(平均時間間隔)でピークになるのではなく、時間間隔が短いほど確率が大きくなるというグラフになっているのですから
イベントの発生の仕方が時間的に一様である
この条件(*)は無記憶性と呼ばれ、「ある時間幅Δxにイベントが発生する確率は、過去がどうであったかに関わらず一定である」と言い換えることが可能です
負の二項分布を考えて、その次に幾何分布を考えて、その後に指数分布を考えて、ポアソン分布との関連をイメージするのがよいかな。。
さらに、無記憶性、どんなに時間が立っていても、次の一定時間にイベント発生する確率は同じ。スタート時点でも同じ。
上記blogをなぞった(劣化しつつ)。
https://gyazo.com/a4a7975de890013387e2d26353101d66
極小時間には、ほぼ起こらないようなこと、非常に失敗確率が高いことが、連続的に?行われてる。
ある時点からXだけ時間経過したときに事象が発生した。
そのXを確率変数としたときに、よく発見される分布。 ポアソン分布は時間あたりの発生回数を確率変数とした場合に発見されるもので、 あるイベントを計測する際に、発生までの時間を確率変数ととるか、一定時間内の発生回数を変数ととるかの違い。
微小時間で、微小発生確率のベルヌーイ試行が絶え間なく行われているような状況を想定できる場合に、指数分布、ポアソン分布を想定できる?
当てられない人は 1/eだけいるは、期待値の回数だけ試行しても -eの割合でヒットしないサンプルがあるという話を書いたけど、指数分布で、ラムダが 1/100 のときに、 100トライすると, -e の割合でヒットしない話と同じ。 指数分布の確率関数は、 $ \lambda exp(-\lambda t)で、 イメージ的には、累積確率分布の方が実用的?$ 1 - exp(-\lambda t)
平均は 1/lambda, 分散は 1/lambda^2
あと、ベイズ推定などで、パラメータ、分散などの事前分布としてよく使われる? (常に正で、平均と偏差がイメージしやすい、累積確率も、期待値までで、1- exp=0.63くらい入ると、イメージしやすいから? なお,指数分布は確率密度関数が比較的単純なので,分布のいろいろな量を求めるよい計算練習になります
部分積分で一生懸命やるでよいかな。 #TOP 分散もやる。