Cou氏の徒然日記

ほのぼの日記ブログです。

統計検定2級への道 その7 -2変数データの相関、分析-

引き続き、統計検定のお勉強。

今回は、2変数データの分析について。

■ 散布図

2変数  (x, y) = (x_{1}, y_{1}), (x_{2}, y_{2}), \cdots , (x_{n}, y_{n}) についての相関は以下の通り。

f:id:coublood:20210711005347p:plain

f:id:coublood:20210711005352p:plain

■ 共分散 と 相関係数

2変数  X, Y について、

 X = (x_{1}, x_{2}, \cdots , x_{n}) の平均値  \mu_{x}標準偏差  \sigma_{x}

 Y = (y_{1}, y_{2}, \cdots , y_{n}) の平均値  \mu_{y}標準偏差  \sigma_{y}

とした場合、

共分散  \sigma_{XY} = \displaystyle \frac{1}{n} \sum_{i=1}^{n} (x_{i} - \mu_{x}) (y_{i} - \mu_{y})

相関係数  \rho_{xy} = \displaystyle \frac{ \sigma_{XY}}{\sigma_{X} \sigma_{Y}}

と定義する。

 

 \rho_{XY} = -1

f:id:coublood:20210711010541p:plain

 -1 <  \rho_{XY} <  0

f:id:coublood:20210711005352p:plain

  \rho_{XY} = 0

→ 相関なし(無相関)

 

 0 <  \rho_{XY} <  1

f:id:coublood:20210711005347p:plain

  \rho_{XY} = 1

f:id:coublood:20210711010738p:plain

■ 回帰直線

 y = ax +b    (a, b : 定数 ) 

 \quad a = \displaystyle \frac { \sigma_{XY}}{ \sigma_{X}^{2}}

f:id:coublood:20210711012703p:plain 

 

回帰直線は、重回帰分析の結果で出てくるものです。

私の場合、データから回帰直線を求めるために、Excelで重回帰分析をよく使います。

(性能測定の分析、リソースに対するシステム要件の計算など)

このあたりを覚えておくと役に立つ…のかどうかわかりませんが、理屈は分かりますね。