t分布
2つの母平均(正規分布が仮定できる場合に)の差を検定したい場合に使う
また、この2つの(未知)母分散は等しいという仮定もある。
ただ、サンプル数の違いがすくなければ、分散の違いはある程度許容できる?
t値は、$ t = \frac{\bar{x}-\mu}{\sqrt(\frac{V}{n})} でその分布をつかって検定する
t値は、標本平均(x_bar)、標本分散(V)、サンプルサイズ(n), uは想定する母平均で、帰無仮説で否定できれば、標本の平均は有意に、想定の母平均とは違うと結論づけられる。
$ \sqrt(\frac{V}{n})は, 標本平均の標準偏差(測定されてない母平均に対する?)で、標準誤差と呼ばれる。 標準誤差は、サンプル数の二乗根に比例して小さくなるので、t値はそれに比例して大きくなる
導出の部分を頭に刻む。
言葉で行くと、正規分布からの標本(サイズn)を取る(標本は1つ)。
標本平均だして、不偏分散を計算する(標本平均との差の二乗和を自由度で割る, 母分散の不偏推定量)。 不偏分散から標準偏差を出す。標本平均から標準偏差で割ると、偏差あたりの期待できる量(効果量)になるが、 そこにはいかず、平均値を標準誤差でわって、どれくらいその値が何かからずれてるか?を見た値。 検定する場合は、帰無仮説のモデルパラメータから、真の平均が提出されるので、標本平均と真の平均の差を取る。
それを標準化?するためには、分散(標本平均と真の平均の差の二乗)で割ればいいけど、 ないので、サンプルから出した不偏分散をサンプルサイズで割ってルートを取った値(標準誤差)で割る。 結果?、標準誤差あたりの(想定する真の)平均からのずれ、ということになる。
そうすると、その統計量は、パラメータが自由度(ここだとサンプルサイズ-1)で決まる、t分布の確率密度関数に従う量となる。 ベイズ推定でのt分布のパラメータ推定
t検定にとってかわるつもりのt分布でのパラメータ推定?みたいなで、自由度もパラメータの一つとして推定できるよう。