カイ二乗検定
2つのデータの間において独立の関係をとっていること。言い換えれば、連続していないデータ。
例えば以下の表のデータがあるとします。
https://gyazo.com/79a4105e3593e94c1d3ae5c49c1de215
でか。
観測データ、いわゆる実測値においてAとBという観測するものがあったとき、どちらとも80個体のデータを得ることにしたと。その中で何か事柄に対して当てはまるか(○)、当てはまらないか(×)の二択でセレクトした時の数となります。
このとき、観測データをもとに期待値の表を作り上げます。
A(○)の期待値を出す場合、
Aのデータの合計値(80) × ○の合計(50)/データの個数(160)
で出すことが出来ます。
データに対して合計値の比の値をかけてやればいいと言う話ですね。
ってことで作った表を以下に挙げました。
https://gyazo.com/11d58db1806ded1b91f249f334d50cea
この期待値をもとにカイ二乗を算出していきますが、
(観測データー期待値)²/期待値
で出せます。またこのカイ二乗の値はA○、A×、B○、B×と全てのデータ、カテゴリにおいて算出する必要があり、それら全ての値を加算した値がカイ二乗の値となるのです。
https://gyazo.com/4d8f496e411740f3e445abfb970e1774
って感じになります。
これを
1+1+0.45+0.45= 2.9
この値(2.9)がカイ二乗となります。
※上記した表は自作のものです