なぜn-1で割るのか
GPT-4.icon
標本分散が \( n \) ではなく \( n-1 \) で割る理由は、**不偏推定量**を得るためです。 具体的には、標本から推定した分散が母集団の分散の期待値と等しくなるように調整するためです。
### 背景
標本分散を計算する際、標本平均 \( \bar{x} \) を使用します。
しかし、標本平均は母集団平均 \( \mu \) の近似値であり、一般的には標本内のデータ点が標本平均に近くなる傾向があります。 そのため、標本内の分散をそのまま計算すると、母集団の分散よりも小さく見積もられてしまいます。
### 数学的な説明
- **偏り**:
標本分散を \( n \) で割ると、母集団の分散の期待値よりも小さい値になりがちです。
- **不偏推定量**:
この偏りを補正するために、標本分散では分母を \( n-1 \) にすることで、標本分散の期待値が母集団の分散と一致するように調整します。
この調整によって、標本分散が**不偏推定量**となり、推定された分散が母集団分散の良い推定値となります。
### \( n-1 \) の意味
- \( n-1 \) を**自由度**と呼びます。 自由度とは、標本のうち、平均を固定した状態で自由に値を取れるデータ点の数を表します。
標本平均 \( \bar{x} \) を使っているため、1つのデータ点は他のデータ点によって決まってしまうので、自由度が1減ります。
### 結論
標本分散で \( n \) ではなく \( n-1 \) で割ることで、母集団の分散の不偏推定量としての性質が得られ、標本分散の期待値が母集団分散に一致するように調整されています。
これは、標本データを用いて母集団の分散を正確に推定するために重要な調整です。