Cou氏の徒然日記(2022)

ほのぼの日記ブログです。

統計検定2級への道 その17 -カイ二乗分布-

  

coublood.hatenablog.com

 

引き続き、統計検定のお勉強。

カイ二乗分布

「自由度  n のカイ( \chi) 二乗分布」とは確率密度関数が以下の  f(x) である確率分布のことを言う。

 \hspace{10mm} \displaystyle f(x, n) = \frac{1} {2^{\frac{n}{2}} \Gamma(\frac{n}{2})} \cdot x^{\frac{n}{2}-1} e^{-\frac{x}{2}}

★ ガンマ関数

 \displaystyle \hspace{10mm} \Gamma(x) = \displaystyle \int_{0}^{\infty} t^{x-1} e^{-t} dt

☆ ガンマ関数の特性

  •  \Gamma(n+1) = n \Gamma(n)
  •  \Gamma(n+1) = n!
  •  \Gamma(1) = 1

 

…といっても、t-分布と同じく、この式を覚えるのは大変で、計算も大変なので、統計検定2級の範囲では特に覚える必要はなく、どちらかというと、カイ二乗分布とは何かということを覚えれば問題ないようです。

 

t-分布では、標本平均の評価のためでしたが、カイ二乗検定は、母分散の検定分布の適合度判定などに使われる検定。それに使われる分布がカイ二乗検定になります。

 

標準正規分布  N(0,1) から無作為に取り出した標本  X_{1}, X_{2}. \cdots, X_{n} について、

 \hspace{10mm} \overline{X} = X_{1}^{2} + X_{2}^{2} + \cdots + X_{n}^{2}

とすると、 \overline{X}カイ二乗分布  \chi^{2} (n) に従う。

 

そのため、正規分布  N(\mu, \sigma^{2}) から取り出した標本  X_{1}, X_{2}. \cdots, X_{n} について、

 \displaystyle \hspace{10mm} \overline{X'} = \sum_{i=1}^{n} \left( \frac{X_{i} - \mu}{\sigma} \right)^{2} 

とすると、 \overline{X'}カイ二乗分布  \chi ^{2}(n) に従う。

 

また、 X, Y の分布がそれぞれ  \chi^{2}(m), \chi^{2}(n) に従う場合、

 X+Y の分布は、 \chi^{2}(m+n) に従う。

 

 X \chi^{2}(n) に従う分布の場合、

  • 期待値  E(X) = n
  • 分散  V(X) = 2n

となる。

 

ただ、実際には母平均  \mu や母分散  \sigma^{2} が未知である場合、標本平均  \overline{X} や 不偏分散  U^{2} を使用することになるため、

 \displaystyle \hspace{10mm} \overline{X''} = \sum_{i=1}^{n} \left( \frac{X_{i} - \overline{X}}{\sigma} \right)^{2} = \frac{1}{\sigma^{2}} \sum_{i=1}^{n} (X_{i} - \overline{X})^{2} = \frac{(n-1)U^{2}}{\sigma^{2}}

は、 \overline{X''}カイ二乗分布  \chi ^{2}(n-1) に従う。(自由度が一つ下がる)

 

このあたりは、実際に演習問題を解きまくって掴むしかないですね。