正規分布
$ f(X) = \frac{1}{\sqrt{2\pi \sigma^2}} \exp{(-\frac{(x-\overline{x})^2}{2\sigma^2})}
確率密度関数なので全区間で積分して1になる.
$ N(\mu, \sigma^2)と表すこともある.
NはNormalのN
標準正規分布というのもあり,全ての正規分布は標準正規分布に変換できる.
データの68%が,平均値 ±$ \sigma(標準偏差)に収まるという性質がある.
平均値 ±$ 1.96\sigmaにデータの95%が収まる
正確には1.96でないが,ならわしとしてぴったり1.96が用いられる.
平均値 ±$ 2.58\sigmaにデータの99%が収まる
99%の信頼区間
逆に,
平均値 ±$ 2\sigmaにデータの95%が収まる
平均値 ±$ 3\sigmaにデータの99.7%が収まる
2シグマ区間,3シグマ区間と呼ぶ.
ガウス分布とも呼ばれる.
平均値と中央値と最頻値が一致する.
分散が大きくなるとより平べったい山の形になる.
母集団がどのような分布に従っていても,その標本平均の分布は$ nが十分大きい時,$ N(\mu, t)に従う.
中心極限定理
身長やコインを投げて表が出る回数の分布などに現れる.
#WIP