Cou氏の徒然日記

ほのぼの日記ブログです。

統計検定2級への道 その10 -不偏推定量-

coublood.hatenablog.com

前回からかなり空いてしまいました。

忙しいとどうしても後回しにしちゃいがちなのがよくないですね…。

引き続き、統計検定のお勉強。

 

■ 不偏推定量

以前、不偏推定量の定義は抜き出して書いていますが、あれだと正直何?という感じになるので、復習のために再度整理。

 

母集団から取り出したサンプル(標本)のサイズ(個数)を n とする。

 n \rightarrow \infty とした場合に、推定量の平均値が母集団の平均値に一致する推定量のことを「不偏推定量という。

母集団から取り出した標本の平均は、母集団平均  \mu を偏りなく推定する不偏推定量になる。

★ 不偏標準偏差

 \quad s = \sqrt{s^2} = \displaystyle \sqrt{ \frac{1}{n-1} \sum_{i=1}^{n} (x_{i} - \overline{x})^{2}}

 

本来は  (x_{i} - \mu)^{2} とするところを、母集団平均  \mu が未知数のため、 (x_{i} - \overline{x})^{2} としているため、 \overline{x}  \neq \mu となる。

 \overline{x} は標本の平均値、つまり母集団の中の一部の要素の平均値であるため、各 (x_{i} - \overline{x})^{2} の値は  (x_{i} - \mu)^{2} の値よりも小さくなる。

つまり、 \sum (x_{i} - \overline{x})^{2}  \ge \sum (x_{i} - \mu)^{2} となってしまう。

そのため、 n ではなく  n-1 で割ることで、過小評価になることを補正する。

 

実際に  n-1 で割ればいいというのは、

 \quad \hat{\sigma}^{2} = \displaystyle \frac{1}{n} \sum_{i=1}^{n} (x_{i} - \overline{x})^{2}

と置いた  \hat{\sigma} の期待値を計算することで

 \quad E[\hat{\sigma}] = \displaystyle \frac{n-1}{n} \sigma^{2}

となることから、

 \quad s^{2} = \displaystyle \frac{n}{n-1} \hat{\sigma}^{2} = \displaystyle \frac{1}{n-1} \sum_{i=1}^{n} (x_{i} - \overline{x})^{2}

と補正することで、

 \quad E[s^{2}] = \sigma^{2}

となるところからですね。