自由度
推定量(分散のみ?)を計算する際に。サンプルサイズnから計算するとして、計算時に使ったサンプルの数。
計算の中で、計算結果を定数として使うと、その分消費される。
分散分析 などで、どういう推定量(分散)を求めてるかを意識しないと、???となる。
意味合いが、、まだつかめず。。。参考になりそうな部分を拾ってるけど..
分散? の適正なdenominatorを定めるためのもの?
分散は情報量と結びつく概念なので、なんかモヤっとは近い所にいそうだ/ど、、
(おまけ) イラストでわかる自由度と不偏分散
効果の2乗を情報量と呼びます
自由度とは - Minitab
自由度とは、未知の母数の値を推定して推定値の変動性を計算するために「費やす」ことが可能なデータの情報量のこと
推定値の変動性に費やした数。
#入門統計学
自由になる度合いのことなのですが、、、平均を求める場合に発生する... 結局、分散などの他の統計量でも平均を用いて,,,
第5回 パラメトリック統計学への登り道② ―自由度とは何か - 統計の落とし穴と蜘蛛の糸 - Smart Lab Life - 羊土社
さらっとは読めたが、、有用な引っ掛かりを得られなかった。
単回帰分析の回帰の自由度についての質問回帰の自由度が1になるのはなぜで... - Yahoo!知恵袋
....自由度もまたこのような選択の「自由度」に例えて説明することができる概念であり
Econometrics Beat: Dave Giles' Blog: Degrees of Freedom in Regression
パラメータ数kのモデルの残差の自由度が (n-k)(サンプルサイズ - パラメータ数)になる話。
計算は追えたけど、、それ以上わからない。
$ \bold{\epsilon} = (\bold{I} - \bold{X}(\bold{X^t}\bold{X})^{-1}\bold{X^t})\bold{y}
$ \bold{\epsilon} = \bold{y} - \bold{X}\bold{\beta} から
* $ (\bold{I} - \bold{X}(\bold{X^t}\bold{X})^{-1}\bold{X^t}) の部分は、冪等行列になると。
不偏分散のときの計算式
標本平均の分散(誤差分散を加えないと..
$ \sigma^2 = \frac{\sum_{i=1}^n(x_i - \mu)^2}{n} = \frac{\sum_{i=1}^n(x_i - \bar{x})^2}{n} + \frac{\sigma_{\bar{x}}^2}{n}
$ \therefore \frac{\sum_{i=1}^n(x_i - \bar{x})^2}{n-1} = \hat\sigma^2
わかってない、、いつこれを書いたのか。。
標本平均を使用してるので(標本平均を先に決めてしまったので自由になる数は1つ減る。)
標本分散は、中心値に標本平均を使ってるので、分散が小さくなりやすいのは直感的には理解できる(ようになった)
#20180522