引き続き、統計検定のお勉強。
■ カイ二乗分布による適合度検定
検定対象の各属性を とする。
その各属性に対する観測度数を 、その各属性での期待確率を とする。
この時、全サンプル数を とすると、確率度数は となる。
この時の検定としては、
帰無仮説として、検定量である の値が、カイ二乗分布 に従う分布であるため、カイ二乗分布 の分布から、例えば95%信頼区間に入っているかどうかで、棄却するかどうかを判定すればよいです。
■ カイ二乗分布による独立性検定
2つの分類が独立であるかどうかの検定になります。
- 帰無仮説 :2つの分類が独立である(関連性がない)
- 対立仮説 :2つの分類が独立ではない(関連性がある)
まず、検定対象の1つ目の分類を とする。
同様に検定対象の2つ目の分類を とする。
そして、各属性を、例えば、 の組み合わせの場合 のように表した場合に、それぞれの についての「理論値 」を算出。
続いて、その理論値を使って、ズレの2乗を理論値で割ったものの総和を算出。
これは、カイ二乗分布 に従うので、上記で求めた p値と カイ二乗分布から有意水準以下かどうかで、帰無仮説を棄却するかどうかで判定になります。
最初はカイ二乗分布は、母分散の検定くらいかなと思っていましたが、案外色々な検定に使えるんだなとびっくりですね。