散布度
https://takuminotie.com/wp-content/uploads/2016/08/%E6%95%A3%E5%B8%83%E5%BA%A6.png
より引用
Snorlax.iconWikipedia(下部リンク)によると名称問題が起きてるようなので他サイトと一部名称が異なってるかもしれません。ご了承ください。
Wikipediaのリンク
分散
平均値からの分布の散らばりを示す値。
母集団の分散である母分散、標本の分散である標本分散がある。
母分散$ \sigma^2は
$ \sigma^2= \dfrac{1}{n}\sum_{i=1}^{n}(x_i-\mu)^2 ($ \muは母平均)
標本分散$ s^2は
$ s^2= \dfrac{1}{n}\sum_{i=1}^{n}(x_i-m)^2($ mは標本平均)
しかし母分散$ \sigmaと標本分散$ s^2は一致しないことが統計的に証明されている。
母分散$ \sigmaの値を推定するために不偏分散がある。
不偏分散$ S^2は標本分散に$ \dfrac{n}{n-1}をかけて
$ S^2= \dfrac{n}{n-1}\dfrac{1}{n}\sum_{i=1}^{n}(x_i-m)^2=\dfrac{1}{n-1}\sum_{i=1}^{n}(x_i-m)^2($ mは標本平均)
Microsoft Excelでは、var.pが母分散(標本分散)、var.sが不偏分散の関数である。
例)あるクラスから5人のテストの点数を抜き出した時、5人のテストの点数の分散を調べたければvar.p、クラスの分散を推定したければvar.sを使うべきである。
標準偏差
平均値からの分布の散らばりを示す値。
分散と違い、標準偏差は元のデータの単位と一致する。
実社会ではこちらが使われている。
母標準偏差$ \sigmaは
$ \sigma= \sqrt{\dfrac{1}{n}\sum_{i=1}^{n}(x_i-\mu)^2} ($ \muは母平均)
不偏標準偏差$ Sは
$ S=\sqrt{\dfrac{1}{n-1}\sum_{i=1}^{n}(x_i-m)^2}
不偏分散の平方根を不偏標準偏差とみなしてよいかは意見が分かれる。
Microsoft Excelでは、var.pが母標準偏差、var.sが不偏標準偏差の関数である。
参考サイト
統計Web
#テーマ2