Cou氏の徒然日記(2022)

ほのぼの日記ブログです。

統計検定2級への道 その12 -p値-

引き続き、統計検定のお勉強。

coublood.hatenablog.com

今回はp-値について。

 

p-値 (Probability)

帰無仮説が正しいと仮定した場合、観測された値以上に外れた値が出る確率。

つまり、その観測値が仮説のもとどれくらいの確率で出たものなのかを表す値になります。

なので、p-値が基準値よりも小さい場合は、帰無仮説が妥当ではない、つまり帰無仮説は正しくないと判断することになります。

帰無仮説棄却の判断基準として、p-値が 0.05以上かどうかが使われていますが、どうやら根拠はないようです。

 0.05ということは、20回に1回は外れるくらいなら許容という判断になるということですね。

  •  p \lneq 0.05帰無仮説を棄却する。対立仮説を指示する。
  •  p \ge 0.05帰無仮説を棄却せず、判断を保留する。

 

 p-値の求め方

明らかに片方の面が出る確率が高いコインのように思える場合に、コインの裏表の出方が同等かを検証する場合を想定します。

 

帰無仮説「表裏の出る確率が等しい」になります。

その帰無仮説が正しいと仮定した場合、つまりコインの裏表の出る確率がそれぞれ同等である場合、表の出る確率は  \displaystyle \frac{1}{2}、裏の出る確率は  \displaystyle \frac{1}{2} であることになります。

 

例えば、コインを5回投げて表と裏がそれぞれ何回出たかで検証するケースで仮説検証を行うとすると、帰無仮説は 

  • 表が0回、裏が5回出る確率  = {}_{5}C_{0} (\frac{1}{2})^{5} = \frac{1}{32} =  0.03125
  • 表が1回、裏が4回出る確率  = {}_{5}C_{1} (\frac{1}{2})^{5} = \frac{5}{32} =   0.15625
  • 表が2回、裏が3回出る確率  = {}_{5}C_{2} (\frac{1}{2})^{5} = \frac{5}{16} =   0.3125
  • 表が3回、裏が2回出る確率  = {}_{5}C_{3} (\frac{1}{2})^{5} = \frac{5}{16} =   0.3125
  • 表が4回、裏が1回出る確率  = {}_{5}C_{4} (\frac{1}{2})^{5} = \frac{5}{32} =   0.15625
  • 表が5回、裏が0回出る確率  = {}_{5}C_{5} (\frac{1}{2})^{5} = \frac{1}{32} =   0.03125

となります。

これの累積確率を考えていくと、

  • 表が0回の場合: 0.03125 ( < 0.05 )
  • 表が1回の場合: 0.03125 + 0.15625 = 0.1875 ( > 0.05 )
  • 表が2回の場合: 0.03125 + 0.15625 + 0.3125 = 0.5 ( > 0.05 )

となります。

 

 p-値は、この累積確率に当てはまるため、例えば表が1回〜4回となった場合は、 p-値が0.05よりも高いため、帰無仮説は棄却できません。

 

しかし、5回とも表、もしくは5回とも裏である場合は、これはこの帰無仮説 p-値が 0.05よりも小さくなり、帰無仮説は棄却となり、対立仮説である「コインの裏表の出る確率は同等ではない」を支持することになります。

 

実際、コイン5回の回数で計測しているので、どんなに偏っていても、1回出れば正常範囲内と考えられるので、判定材料としては正しいかはかなり微妙。

正直、仮説検証の判定に使うのは弱いので、実際はもっと回数を増やしてやるべきレベルではあると考えられます。

ただし、そもそもデータを出すために何回も検証して、ほぼ全ての検証で表5回(もしくは裏5回)となる時点で、メチャメチャ偏っていて、普通のコインとは考えにくいですね。