統計検定2級
参考文献
問題集の解説がある
Logs
愛する妻のかわいいピンクの計算機借りたのだが
相関係数が 0 → 独立?
互いに独立な確率変数同士の相関係数が 0 ならない状況はない?
基本的な計算
$ (x+1)!/x! = x+1 ぱっと分からなくても x=1 入れれば気づく 2*1/1
組み合わせ
$ _nP_r = \frac{n!}{(n-r)!}
$ _nC_r = \frac{_nP_r}{r!} = \frac{n!}{r!(n-r)!}
$ _nC_r = _nC_{n-r} 4つから3つ選ぶ組み合わせと4つから1つ選ぶ組み合わせは同じやつ
復元・非復元
袋から取り出したやつを戻してまた取るのが復元
復元 = 二項分布 : 当たる確率 p は変わらず独立
非復元 = 超幾何分布 : 試行ごとに当たる確率変わる、組み合わせの話
母集団が十分大きい時に近似として二項分布にすることはある
復習
ここいらで電卓持ち込み可であることに気づく
ルート覚えてるの前提か?? となって気づいた
正規分布の再生性
これルート2覚えてる前提か? ひとよひとよに
線形変換
$ E[aX+b] = aE[X]+b 平均はそのまま
$ V[aX+b]= a^2V[X] 分散は差の項がなくなるのもわかる
$ SD[aX+b]= \sqrt{a^2V[X]}=|a|SD[X] 分散のルートまま
右回りにオーにちょん、オー自体ゼロと同じく左回りで書いてるわ
しばらく赤い本読んでた、丁寧で大変良いし名著なの分かるけど問題まで遠いなー
問題から潰すほうが効率よさそうだし、問題文読む → 関連するところさらっと読む → 問題解く かなあ
そして偏相関係数知らなかった
擬似相関かもしれないね気をつけようね的話は何度も聞くけど、この話がそれほど出ないのはなんでだろう?
問題集の最初のやつ5章終わったところだから復習しておくか
共分散手計算でできるか
$ Cov(X, Y) = \sum_{i}^{n}\frac{(x_i-\mu x)(y_i - \mu y)}{n} = E[XY]- \mu x \mu y
X の偏差 * Y の偏差 の平均
標本からなら不偏分散のように n-1 で割る
ラスパイレス指数
$ \sum_{i=1}^{n}p_{ti}q_{0i} / \sum_{i=1}^{n}p_{0i}q_{0i} \times 100 0 基準年, t 比較年
基準年に購入したのと同じ数量を購入した際の価格変化を比較する
比較年の数量($ q_{ti})は出てこない、基準年のみなので現実で集計しやすい
パーシェ指数
ラスパイレス指数の比較年で重み付けた方
どっちも 100 が基準に高くなった安くなったのはなし
相関係数
$ r_{xy} = \frac{Cov(X, Y)}{\sigma_x \sigma_y}
今見るとめちゃめちゃ意味がわかる
$ P(X=x) は確率変数 X が実現値 x という値を取る確率
確率関数
確率質量関数 / 確率密度関数 は 離散 Σ / 連続 ∫ の関係
モーメント!! まだぜんぜんわからんが歪度・尖度の定義につながる 共分散・相関係数を求めるの一度手計算でやっておく
全然わかんなくなってきた、先に統計 Web 読むか
二項確率の比
しばらく空いた
正規確率の計算
Z 求めて標準正規分布にして(=標準化) 1 から引いていく
確率変数の関数の期待値
場合分けして掛けていけばいいのはわかったけど計算で詰まる
$ \int_{a}^{b}f(x)dx = \int_{0}^{b}f(x)dx - \int_{0}^{a}f(x)dx この変形ないとめちゃ大変
二項分布の正規近似
感覚で選択肢からこれでしょとは選べたけど全然説明できない
標本得票率は 54/100
標準誤差だす
$ SE = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}
境界点に対応する Z スコアを出す
ここ標準誤差で割ってるの標準化の操作なのはわかるけど無からやっていい自信でなさそう
表から探して両側なので *2 して 1 から引く
まず $ P(|\hat{p}-p| \le 0.1) の意味取れているか
標本得票率が、真の得票率から 0.1 以下の範囲にある確率
(真の得票率 p が 50% だとすると、標本得票率が 40% ~ 60% の範囲にある確率)
そろそろわからん割合がでかくて勘で行きづらい
二段階実験確率の期待値
これ $ P[X = 0, 1, 2] と場合分けせずにやったけどいいのかな
対戦順の説明の正誤
これ知らなかった、直感と逆じゃん
確率分布の定数の決定
面積の合計が 1 になる
標本誤差と非標本誤差
抽出の際におきる誤差 = 標本誤差 / そうでないものは非標本誤差
誤回答や未回答、抽出段階での偏りや排除は非標本誤差
積事象・ベイズの計算
まあ基本問題は作業かな、この辺の操作
$ P(A \cap B) = P(A|B)P(B)
$ P(B) = P(A \cap B) + P(\overline{A} \cap B) = P(B|A)P(A) + P(B|\overline{A})(1-P(A))
条件付き期待値
$ E(X) = 1/p で素朴
独立・背反
背反なら $ P(A \cap B) = 0
独立ならこれ成り立つか見る
$ P(A \cap B) = P(A)P(B)
$ P(A \cup B) = P(A) + P(B) - P(A)P(B)
相関係数の計算 & 相関係数からグラフを絞る
相関係数
$ r = \frac{S_{xy}}{S_xS_y} = \frac{x と y の共分散}{S_xの標準偏差・S_yの標準偏差}
変形して共分散出す
$ S_{xy} = rS_xS_y
切断効果
データの一部を切り取ると傾向や指標が変わること
そりゃそうだろ
抽出法
観察 or 実験
介入があれば実験
フィッシャーの三原則
実験計画の原則
反復・無作為化・局所管理
範囲眺める
季節変動 = 1年周期 って定義あるのね
乗数の操作久々すぎる
$ \sqrt[3]{2} = 2^{1/3} とか$ (\sqrt[3]{2})^{3} = (2^{1/3})^{3} = 2
四分位数
どっちが第一四分位だっけとなる → 小さい順 = 第一四分位=25%tile
四分位範囲 = IQR = 75%tile - 25%tile
ローレンツ曲線・ジニ係数
なにかと思ったけど累積度数だ
累積度数と平等線の間の面積*2、最大1
完全平等線 = (0,0) と (1,1) を結ぶ線
上に凸 / 下に凸
コレログラム
ラグと自己相関係数のグラフ
ラグ=0 なら自身と同じ値なので相関係数1
ラスパイレス指数
なにこれ