階層ベイズ
$ Yi∼Normal(θi,Si)
$ θi∼Normal(μ,σ)
真のモデルから個別の効果の平均パラメータが出て、効果の平均パラメータと分散から、観測された値がでたと考えて、
(当てはまりのよい, 尤度が最大になる θi を推定する )
まだ、理解できてない...
@201912
@201712
まだわかってない。手を動かしてないせいだろうけど、、
おもいつくまま。
よくある例が、過分散への対処。
個々のデータが、個々にパラメータを持つと考える。
普通はデータ数 < パラメータ数なので、当然だめ(過学習)だけど、
それらのパラメータが、ある分布からの値(分布?) を持つとなれば、、、