推定
前 仮説検定
標本調査
母集団から標本を抜き取って何かの割合を調べるなどして、母集団について何か主張する
無作為抽出して無作為標本を作り、母集団と似た分布を作らないとこれができない
視聴率
抜き取り調査
母集団の大きさ
母集団の要素の数N
標本の大きさ
標本1つの中の要素の数
母数
母集団の統計的性質を表す指標p
無作為抽出には以下の仮定を適用する
無作為抽出した要素が性質Aを持つ確率は、母集団の母数pに等しい
Aは複数の要素の間で独立な性質
母数の推定がしたい
要素が持つある性質Aの確率をpとおく
大きさnの標本で性質Aを持つ要素がx個あったとすると、割合はx/n
よってp=x/nと推定
x/nのことを推定量という。
Aの確率変数をXとおくと、Xの実現値がx/nである。
X/nは推定値と呼ぶ
?
母集団の要素のことを何という?
標本点という言い方がある
ググって適当に見ただけなのでこれが正しいという確証がない
とりあえず要素と言っておくか。元や根元事象のほうが正しそうではある。
推定量
無作為標本においてXは二項分布に従う
$ P(X=x)=\begin{pmatrix}n\\x\end{pmatrix}p^x(1-p)^{n-x}
二項分布の性質から、
$ E(X/n)=E(X)\cdot1/n=p
$ V(X/n)=V(X)/n^2=np(1-p)/n^2=\frac{p(1-p)}n
誤差の種類
系統誤差
偶然誤差
こっちに気を使う
非復元抽出
一度選ばれた元は母集団から除外
復元抽出
一度選ばれた元を除外しない
母数の推定
推定量
推定値
推定の誤差
区間推定
信頼区間
信頼係数の意味
次
適合度
メンデルのエンドウ豆実験は統計的に正しいか?
確率モデル
観測度数
N個のエンドウ豆を観測し、$ A_iの豆が$ x_i個あったとすると、x_iはA_iの観測度数。
仮定と仮説H
理論度数
$ Np_i
出現確率$ p_iは観測度数から推定する
推定#697ff8bd0000000000bcfa05
適合度の定義
$ \chi^2=\sum_{j=1}^{4}\frac{(x_j-Np{_j})^2}{Np{_j}}
大きさ$ Nの無作為標本に属する元のうち階級$ A_jに属する元の数を$ X_jとする
階級は$ r種ある
定理
$ \chi^2=\sum_{j=1}^{r}\frac{(X_j-Np{_j})^2}{Np{_j}}
カイ二乗の値は近似的に自由度$ r-1の$ \chi^2分布に従う
カイ二乗分布
標準正規分布$ N(0,1)に従う確率変数Z1....があるとき、
$ \chi^2=Z_1^2+Z_2^2+Z_3^2+\cdots+Z_r^2=\sum_{i=1}^rZ_i^2
は?
任意の正規分布$ N(\mu,\sigma^2)に従う確率変数$ X_1,\cdots,X_rがあるとき
$ z_i=\frac{(x_i-\mu)}{\sigma}で標準化したとすると、
これを先ほどのカイ二乗分布に代入すると
$ \chi^2=\sum_{i=1}^r\frac{(x_i-\mu)^2}{\sigma^2}
で、自由度rのカイ二乗分布に従う
「適合度」と「適合度の実現値」は同じ意味?
同じ意味(後者は代入した値という意味を強調している)
ダメだ!語の関係性を頭に入れるところから始めるといつも時間の使い方としてナンセンスな感じになる
問題を解くところから始めよう
たぶん私が数学のテストで点数が取れない理由の一つが勉強時間の使い方のミスだろう
土壇場で勉強したとしても私より点数が取れている友達はいる。元々の実力の差もあるけどやり方がまずおかしい
上のメモはノートまとめをしているつもりではなく、書かないと頭に入らないので読解のためにやっている。しかし実質ノートまとめの時間の使い方になってしまっている。(今回の場合テスト対策ではないが)
それ自体は問題ではない。試験1か月前から勉強するならそれでいい。
土壇場でやるなら問題演習に時間を割けというだけの話だ。
試験以外でも問題解いてから入ったほうが良いとは思う
いつも問題解けなくて萎えて離脱してる
つまりバッドパターンとして定着しているのにも関わらず繰り返してしまっている
2/14
定理
t分布
$ t =\frac{\bar{X}-\mu}{\frac{1}{\sqrt{n}}s}
が、自由度(n-1)のt分布に従う。