確率変数周りの略称名
確率変数 確率関数 (累積)分布関数 (累積は特に付かない場合も多いけど、同じ意味) https://gyazo.com/b079abe7adc4a1d6f19a6854d6a57634
rnom(乱数), dnorm(密度), pnorm(分配、確率(分布面積) ), qnorm(pnormの逆関数) Rの正規分布の場合で。 記録に残すというより、記憶しとかないといけない部分だが、、
PDF(確率密度関数): Probability Density Function / PMF: Probability Mass Functoin
PPF(...): Probablility Percent Point Function. Rなら qnormの方かな。
CDF(累積分布関数): Cumulative Distributed Function / SF: Suvival Function, ISF: Inversed Survival Function
PDFは、あくまで密度の値をだすもので、確率にするには区間積分する必要があり、それで、CDFの需要がある。たぶん。
PPFは、
scipyのreference 正規分布のもの
rvsはrandom variable,,,sは samplingかな?
この記事が記憶に残りやすくても良い。
PDF以外は、みんな積分値がリターンされる関数なのはイメージしておきたい。
以下、図をkeisukeのブログさんから、そのまま引用させていただきます。 m_m
pdf よく使われるけど、値は密度なので、相対的にしか意味をつかめない。
http://cdn-ak.f.st-hatena.com/images/fotolife/k/kaisk/20150217/20150217185645.png
cdf
cumulative distribution function, これが、ある値以下を取る確率と、意味が取れる。
CDFの微分がPDFになる。CDFの値は、日常的にこうなる確率みたいな、直感的なイメージでの確率になる。 最大1の量 #20180407 http://cdn-ak.f.st-hatena.com/images/fotolife/k/kaisk/20150217/20150217185556.png
SF : suvival function
1 - cdf ではあるが、、世間で出される数字がこっち側かもしれず。
http://cdn-ak.f.st-hatena.com/images/fotolife/k/kaisk/20150217/20150217190153.png
ppf percent point function. 関数に入れる値が、qになった。qは quantileのQでよいかな。
norm.ppf(q=0.84, loc=0, scale=1)
下図でいくと、0.84%まで取りたいときには、xはどこまでいけばよいのか? 0.99
norm.ppf(q=0.95, loc=0, scale=1)
95%点までみるなら、1.6くらい。(2sigma)
http://cdn-ak.f.st-hatena.com/images/fotolife/k/kaisk/20150217/20150217191203.png
isf sfの逆関数。 cdf -> ppf の関係でいくと、 sf -> isf
http://cdn-ak.f.st-hatena.com/images/fotolife/k/kaisk/20150217/20150217191617.png
interval
a,b = norm.interval(alpha=0.95, loc=0, scale=1)
期待値loc,標準偏差scaleの正規分布のalpha=0.95ぶんだけの分布が含まれる範囲を,メディアンを中心にとって取得します.
とのこと。これは、使いドコロありそう。
http://cdn-ak.f.st-hatena.com/images/fotolife/k/kaisk/20150217/20150217192638.png