自由度 - 未来の自分を助けるメモ

自由度

推定量(分散のみ？)を計算する際に。サンプルサイズnから計算するとして、計算時に使ったサンプルの数。

計算の中で、計算結果を定数として使うと、その分消費される。

分散分析などで、どういう推定量（分散)を求めてるかを意識しないと、？？？となる。

意味合いが、、まだつかめず。。。参考になりそうな部分を拾ってるけど..

分散？の適正なdenominatorを定めるためのもの?

分散は情報量と結びつく概念なので、なんかモヤっとは近い所にいそうだ/ど、、

効果の２乗を情報量と呼びます

自由度とは、未知の母数の値を推定して推定値の変動性を計算するために「費やす」ことが可能なデータの情報量のこと

推定値の変動性に費やした数。

自由になる度合いのことなのですが、、、平均を求める場合に発生する...　結局、分散などの他の統計量でも平均を用いて,,,

さらっとは読めたが、、有用な引っ掛かりを得られなかった。

....自由度もまたこのような選択の「自由度」に例えて説明することができる概念であり

パラメータ数kのモデルの残差の自由度が (n-k)(サンプルサイズ - パラメータ数)になる話。

計算は追えたけど、、それ以上わからない。

$ \bold{\epsilon} = (\bold{I} - \bold{X}(\bold{X^t}\bold{X})^{-1}\bold{X^t})\bold{y}

$ \bold{\epsilon} = \bold{y} - \bold{X}\bold{\beta} から

* $ (\bold{I} - \bold{X}(\bold{X^t}\bold{X})^{-1}\bold{X^t}) の部分は、冪等行列になると。

不偏分散のときの計算式

標本平均の分散（誤差分散を加えないと..

$ \sigma^2 = \frac{\sum_{i=1}^n(x_i - \mu)^2}{n} = \frac{\sum_{i=1}^n(x_i - \bar{x})^2}{n} + \frac{\sigma_{\bar{x}}^2}{n}

$ \therefore \frac{\sum_{i=1}^n(x_i - \bar{x})^2}{n-1} = \hat\sigma^2

わかってない、、いつこれを書いたのか。。

標本平均を使用してるので(標本平均を先に決めてしまったので自由になる数は１つ減る。)

標本分散は、中心値に標本平均を使ってるので、分散が小さくなりやすいのは直感的には理解できる(ようになった)