t検定
2つの独立した母集団があり、それぞれの母集団から抽出した標本の平均に差があるかどうかを検定することを「2標本t検定」といいます。
例えば、とある2組のクラスの平均体重に差があるのか、とか、つまりは2つの複数個あるデータに違いが生まれているのかを調べるのがt検定。
また、2組のデータが同じとき、つまりは時間によってデータが変化するけど、調べる検体、サンプルは同じである時の式は以下のようになる。
https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-bbec58fda8259f4bdb067c41d5f0e870_l3.png
x(上線有):データの平均
μ:母集団の平均
S²:分散
n:データの個数
ってな感じでtが求まるんですけど、、
tの値によってt分布を確認し、帰無仮説を棄却するかを決定するようです。。
2つのデータの間が同じでない場合、つまりはさっきみたいなA組、B組みたいに2組のクラスのデータを用いる場合。
https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-e951489685051bde883a39416be19c69_l3.png
下は母平均が正しい場合。
https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-973972b0b9a3625ee4d62c652ca446fd_l3.png
上の式を使うようです。下の式は母平均が正しい場合なのでμ、母集団の平均はないことになっています。基本的には2つのデータが同じの時とあまり変わりはありませんが、データの個数について逆数を取るようになっているのですね。