自由度
推定量(分散のみ?)を計算する際に。サンプルサイズnから計算するとして、計算時に使ったサンプルの数。 計算の中で、計算結果を定数として使うと、その分消費される。
分散分析 などで、どういう推定量(分散)を求めてるかを意識しないと、???となる。 意味合いが、、まだつかめず。。。参考になりそうな部分を拾ってるけど..
分散は情報量と結びつく概念なので、なんかモヤっとは近い所にいそうだ/ど、、
効果の2乗を情報量と呼びます
自由度とは、未知の母数の値を推定して推定値の変動性を計算するために「費やす」ことが可能なデータの情報量のこと 推定値の変動性に費やした数。
自由になる度合いのことなのですが、、、平均を求める場合に発生する... 結局、分散などの他の統計量でも平均を用いて,,,
さらっとは読めたが、、有用な引っ掛かりを得られなかった。
....自由度もまたこのような選択の「自由度」に例えて説明することができる概念であり
パラメータ数kのモデルの残差の自由度が (n-k)(サンプルサイズ - パラメータ数)になる話。
計算は追えたけど、、それ以上わからない。
$ \bold{\epsilon} = (\bold{I} - \bold{X}(\bold{X^t}\bold{X})^{-1}\bold{X^t})\bold{y}
$ \bold{\epsilon} = \bold{y} - \bold{X}\bold{\beta} から
* $ (\bold{I} - \bold{X}(\bold{X^t}\bold{X})^{-1}\bold{X^t}) の部分は、冪等行列になると。 標本平均の分散(誤差分散を加えないと..
$ \sigma^2 = \frac{\sum_{i=1}^n(x_i - \mu)^2}{n} = \frac{\sum_{i=1}^n(x_i - \bar{x})^2}{n} + \frac{\sigma_{\bar{x}}^2}{n}
$ \therefore \frac{\sum_{i=1}^n(x_i - \bar{x})^2}{n-1} = \hat\sigma^2
わかってない、、いつこれを書いたのか。。
標本平均を使用してるので(標本平均を先に決めてしまったので自由になる数は1つ減る。)
標本分散は、中心値に標本平均を使ってるので、分散が小さくなりやすいのは直感的には理解できる(ようになった)