分散
分散とは,データの散らばりの大きさを表す指標です。
分散の定義式
$ \dfrac{1}{n}\displaystyle\sum_{i=1}^n(x_i-\mu)^2
$ (n:データの数 , x_i:各データの値 , \mu:平均)
分散の式に登場する$ (x_i-\mu)のこと(平均との差のこと)を偏差と言います。
分散は$ \sigma^2という記号で表されることが多い
各データと平均の差が大きい(=データのばらつきが大きい)と、分散の値も大きくなり、各データと平均の差が小さい(=データのばらつきが小さい)と、分散の値も小さくなる。
式から分かるよに、分散は各偏差の2乗の総和で求まるが、2乗をとる明確な理由はない。
各偏差の絶対値の総和を絶対値平均誤差という。
分散の平方根をとったものを標準偏差 ( =$ \sigma)という。
引用元
#テーマ2