Cou氏の徒然日記(2022)

ほのぼの日記ブログです。

統計検定2級への道 その13 -重回帰分析-

引き続き、統計検定のお勉強。

coublood.hatenablog.com

 

今回は統計検定というよりは統計学の分析の内容です。

 

■ 重回帰分析

(重)回帰分析といえば、作成した回帰式を利用して、何らかのデータを予測するもの。

その分析対象の目的変数は連続的な数値データである必要があります。

★単回帰分析

→ 一つの説明変数から目的変数を予測

 \hspace{5pt} y =  ax + b

★重回帰分析

→ 複数の説明変数から目的変数を予測

 \hspace{5pt} y =  a_{1}x_{1} + a_{2}x_{2} + \cdots a_{n}x_{n} + b

 

よくあるのが、ある町にお店を出店します。その場合に、候補の地点が複数ある場合にどの地点にお店を出せばいいかを分析する場合というのがあります。

この時、例えば

  • 「半径1km以内の人口」
  • 「最寄りの競合店舗との距離」
  • 「1時間あたりに通る人の数」

など、様々な条件があります。

これらの条件はいっぱいあり、どういう条件を重要視するか、どういう条件で分析するかといったことは人により異なるでしょうし、今までの経験からどうなのか?という側面もあり、私は専門ではないのでどういう条件で分析するのがいいのかはわかりませんので、あくまで例です。

過去の実績から上記の条件についてどういう傾向があるかを分析することで、上記条件に基づいた重回帰分析式を求め、それを元に、今回の出店候補地の説明変数をもとに目的変数を求めて、分析することになります。

 

例えば、上記条件をそれぞれの説明変数を  x, y, z として、もし目的変数に対してこれらの説明変数の関連があれば、それぞれの回帰係数を  a, b, c とすれば、

 

 目的変数 =  ax + by + cz +d    ( dは切片)

 

という形で表せます。

あとは、この重回帰分析で出てきた式が、実際のデータに対してどの程度の精度なのかなどが重要になってきます。

 

結局はこういった式が出てきても、それが使い物になるものなのかどうかはポイントになりますね。

たまたま参考にしたサンプリングではこの式に沿った値になっていても、母体(全体)でもそうなるかというのは別問題ですので。