推定量
得られた標本から、母集団の(想定したモデルの)パラメータを推定したい。
標本は、サイズがある。
通常はサイズは2以上で、その標本平均などを計算して、それを推定量とする。
標本平均の期待値を取る、モデル?の期待値 に nを掛けて、割るので、期待値が標本平均に一致する。
計算の途中の二乗の処理のところで、$ \muを入れる
脱線だけど、ここの部分は、微分の積の公式を出すところににてる。 A−B を評価したいが,そのままでは難しいので (A-C)+(C-B)(A−C)+(C−B) と変形することで評価するという手法
期待値とシグマ計算の定義をじっくり考える
期待値計算でシグマを外に出す
分散の定義をきっちり考える
---------------------------
$ \hat\theta
母集団の本当のパラメータは、神様にしかわからないので、推定量を出す
その量の出し方(計算方法)を、いろんな指標に従って評価する。
不偏、一致性、最尤(尤度最大), まとめて最良かどうか
推定量の質は一般に平均二乗誤差で評価される
日本工業規格では、「母集団のパラメータを推定するのに用いる統計量。」と定義している そういう計算方法をした場合に、その値がどういう性質を持つか?
一致性(サンプルサイズを無限大にすれば一致する),
不偏性(期待値にしたときにbiasがない)、有効性、頑健性など。 統計の勉強はじめたころに、推定量のことをじっくり考えるべきだった。(定義に戻る, 理解できなくとも頭に残す?)
推計統計学では、この量をめぐって、検定したり、信頼区間だしたり、議論する。
(点)推定値estimate. estimatorは推定量.こういう計算をした量です。みたいな。
サンプルからなんらかの計算をして統計量が得られる。 この統計量は、母集団(真の集団)のモデルが持つ、ある値(複数あり)、パラメータと一致するだろうか?
当然?いっしょにならないので、それは誤差。
では、その統計量の期待値とは一致するだろか?
期待値で一致するなら、その推定量は不偏。 unbiased biasがある場合はどうする?
標本平均については、分布を想定しなくても、中心極限定理で、その分布の平均の不偏推定量になる。 平均がない分布,コーシー分布からの標本でがある場合は、その限りではない。
誤差は、このバイアスに分散を加えたもの。で、分散はサンプルサイズが増えれば減少していく。一致性。 サンプルサイズを増やしても、その推定量の分散が減少しない場合は、その推定量(推定計算方法)一致性がないとなる。
よって、ある標本が得られた際に計算して推定量と真の値との差、誤差は、
このバイアスと分散の和で、それも推定量で、、メタな展開.....
誤差の二乗和という値の推定量になる。
不偏推定量なので、期待値をとると、等式で結べる。$ E[(\hat\theta - \theta)^2] = Var(\hat\theta) + Bias(\hat\theta)
推定量を用途という観点で分けると、2つに分かれる
点推定量、区間推定量の2つ。不偏推定量の値と、一致推定量との想定で、そのサンプルサイズでどれくらいの一致レベルかで、推定量の区間を決める。この推定量の誤差と効果量の比を検定で議論することになる。