負の二項分布
意味・意義
必要な数を集めたいときに
特徴
ガンマ分布の離散版?
code:R
library(tidyverse)
data_frame(k = rnbinom(n = 100000, size = 3, prob = 2/5) + 1) %>%
ggplot(aes(k)) +
geom_histogram(aes(y=..count../sum(..count..)), binwidth = 1)
https://gyazo.com/2c7153ac2124611f0c3c308d6ec34d95
イメージとしては、野球で一回の打席で、投手が投げる、投球数
2/5 の確率で(ヒットするか、三振になるか、フォアボールになるか)...三振とフォアボールはいきなりはならないか。。。
素直に、当たりクジを引くまでの試行回数としておくのがよいかな。
ポアソン分布に形状がにてる感じ。 ラムダが4くらいか。 上図は、 rnobinom(size=3, prob=2/5)の例
参考:
この本では、GLMM の例として、R の glmmML パッケージを使って「パラメータが正規分布に従う二項分布」の推定を行っています。
これに対して、負の二項分布は「パラメータがガンマ分布に従うポアソン分布」だと考えれば同じ枠組みでとらえることができると思います。
Maybe one process leads to the zero/non-zero data and another leads to the non-zero magnitude.