統計学
【データの分類】
質的変数:カテゴリー別(性別など)
量的変数:数値データ(離散型・連続型)
【データの要約指標】
中心傾向
平均値:$ \bar{x}=\frac{\sum x}{n}
中央値:データの中央値
最頻値:最も頻出する値
散らばり
分散:$ s^2=\frac{\sum(x_i-\bar{x})^2}{n-1}
標準偏差:$ s=\sqrt{s^2}
範囲(最大値-最小値)
四分位範囲(IQR)=Q3-Q1
/icons/hr.icon
【確率と確率分布】
加法定理:$ P(A\cup B)=P(A)+P(B)-P(A\cap B)
条件付確率:$ P(A|B)=\frac{P(A\cap B)}{P(B)}
ベイズの定理:
$ P(A|B)=\frac{P(B|A)P(A)}{P(B)}
🔹離散型分布
ベルヌーイ分布:成功確率p
平均:p, 分散:p(1-p)
二項分布:n回試行、成功回数
$ P(X=k)=\binom{n}{k}p^k(1-p)^{n-k}
平均:np, 分散:np(1-p)
ポアソン分布:稀な事象の回数λ
平均・分散=λ
幾何分布:成功までの回数
$ P(X=k)=p(1-p)^{k-1}, 平均:$ \frac{1}{p}
🔹連続型分布
一様分布(a,b)
密度:$ \frac{1}{b-a}, 平均:$ \frac{a+b}{2}
正規分布N(μ,σ²)
密度:$ \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)
標準正規分布(z分布):N(0,1)
指数分布:平均待ち時間1/λ
密度:$ f(x)=\lambda e^{-\lambda x}
t分布:小標本、母分散未知時使用
カイ二乗分布:分散の検定に使用(自由度によって変化)
🔹2変数分布
同時分布:2変数の同時発生確率
2変量正規分布:2つの正規分布が同時に分布
相関係数ρによって関係性を示す
/icons/hr.icon
【統計的推定】
🔸点推定:標本統計量で母数を推定
🔸区間推定:母数を含む範囲を推定(信頼区間)
①1標本推定
母平均(母分散既知):$ \bar{x}\pm z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}
母平均(母分散未知):$ \bar{x}\pm t_{\frac{\alpha}{2}}(n-1)\frac{s}{\sqrt{n}}
母分散:$ \frac{(n-1)s^2}{\chi^2_{\frac{\alpha}{2}}}, \frac{(n-1)s^2}{\chi^2_{1-\frac{\alpha}{2}}}
母比率の推定:$ \hat{p}\pm z_{\frac{\alpha}{2}}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}
②2標本推定
2母平均の差:
$ (\bar{x}_1-\bar{x}_2)\pm z_{\frac{\alpha}{2}}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}
母分散の比(F分布):$ \frac{s_1^2/s_2^2}{F_{\frac{\alpha}{2}}}, \frac{s_1^2/s_2^2}{F_{1-\frac{\alpha}{2}}}
母比率の差:
$ (\hat{p}_1 - \hat{p}_2)\pm z_{\frac{\alpha}{2}}\sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{n_1}+\frac{\hat{p}_2(1-\hat{p}_2)}{n_2}}
/icons/hr.icon
【統計的仮説検定】
帰無仮説(H₀)と対立仮説(H₁)の設定
p値により帰無仮説の棄却を判断(p<αで棄却)
🔹1標本問題の検定
母平均(Z検定):
$ Z=\frac{\bar{x}-\mu_0}{\sigma/\sqrt{n}}
母平均(t検定, 母分散未知):
$ t=\frac{\bar{x}-\mu_0}{s/\sqrt{n}}
母分散の検定(カイ二乗検定):
$ \chi^2=\frac{(n-1)s^2}{\sigma_0^2}
母比率の検定(Z検定):
$ Z=\frac{\hat{p}-p_0}{\sqrt{p_0(1-p_0)/n}}
🔹2標本問題の検定
母分散の比較(F検定):
$ F=\frac{s_1^2}{s_2^2}
/icons/hr.icon
【線形モデル分析(回帰分析)】
線形回帰:$ y=\beta_0+\beta_1x+\varepsilon
最小二乗法で推定、決定係数(R²)で評価
回帰係数はt検定で有意性を確認