Cou氏の徒然日記(2022)

ほのぼの日記ブログです。

統計検定への道 その4

f:id:coublood:20191107232831j:plain

■ データの標準化(基準化)

データの値を {\displaystyle {a_1}, {a_2}, …. , {a_n}} ,平均値を {\displaystyle \overline{a}} とした場合,標準化された値 {\displaystyle {z_i}} は以下のように定義する。

{\displaystyle {z_i} = \frac{データの値 - 平均値}{標準偏差} = \frac{ {a_i} - \overline{a} }{\sigma}}

この時,標準化された値 {\displaystyle {z_i}} の平均値と標準偏差

となる。

 

※ 平均値 {\displaystyle \overline{z_i} = \frac{1}{n} \sum_{i=1}^{n} {z_i} = \frac{ {a_1} + {a_2} + ... + {a_n} - n \overline{a}}{\sigma} } = 0

標準偏差は、すべての値から同じ数を増減させても変わらない。そのため {\displaystyle (a_i - \overline{a} ) }標準偏差{\displaystyle a_i}標準偏差と同じになる。そのため、{\displaystyle {\sigma_{z_i}} = \frac{\sigma}{\sigma} = 1} となる。

 

■ 偏差値

試験などの成績の偏差値は、以下の式で定義される。

{\displaystyle 偏差値 = \frac{点数 - 平均点}{点数の標準偏差} \times {10} + 50 }

 

つまり,標準偏差 = 10, 基準値 = 50 の値が偏差値ということになります。

学生の頃、この数値に一喜一憂させられていたのが懐かしいですが、こうやって算出されていることを知ると、なるほどねえと思いますね。