正規分布
ガウス分布とも呼ばれる。
どういう分布なのか?
ブレのある測定の誤差の分布
集団として平均的な値があり、平均周辺に多くのものが集中することが予測される場合の分布。
年齢に対する身長
ランダムウォーク
パチンコの玉
離散分布である二項分布で$ p=1/2の場合を連続化したもの。 具体的にどういう関数になるのか?
$ f(x) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp[-\frac{(x - \mu)^2}{2\sigma^2}]
なぜある種のブレ(多くの場合は測定誤差)を持つデータは正規分布に従うのか?
ガウスが天文学の観測データから、測定誤差を持つデータが特定の分布を持つことを発見し、誤差論を確立した。
誤差の発生要因は偶然誤差のみとする。
経験則として以下が分かる。
正の誤差と負の誤差の発生率は等しくなる。(どちらかへの偏りがない。)
大きな誤差より小さな誤差の方が発生しやすい。
ある程度以上の誤差は発生しない。
以下が証明まで書いてある
どうして$ eが現れるのか?
確率密度関数を求めるために自然対数と微分方程式を使うため。
自然対数を取ることで乗算を加算の形に変えることができる。
(対数の底は実はどれでも構わないが、変えても係数が変わるだけである)
どうして$ \piが現れるのか?
自然対数$ eを使った積分(ガウス積分)になっているため。 なぜ正規分布に「π」が現れるか https://www.youtube.com/watch?v=lXLHPMJ-u5c
やや説明が端折られているので確認。
唐突に $ a = -1/σ^2が出てくる。
(2) の方で分散$ σ^2がどう割り当てられるのか書いてある。
分散は裾野の大きさを意味する。「ある程度以上の誤差は発生しない。」という拘束条件に相当する。
分散を正規化することで結果的に正規分布が出てくる。
逆に正規分布に測定から得られた分散を掛け合わせると、実態に合った分布になる。
偏微分では、元の変数を含まない項(定数項)は0になる。
このため、$ x_2~$ x_{n-1}の項は消える。
このような偏微分をして構わないのか?
すべての項($ x_2~$ x_{n-1})で同じ計算をすることができるので、問題がない。
参考