現在位置 : 統計WEB|統計解析事例|重回帰分析
重回帰分析
※ このコンテンツは「エクセル統計2008」を用いた解析事例です。
下図のデータは、野球選手20人について球速、遠投、懸垂、握力を測定した結果です。重回帰分析を用いて球速に影響を与える要因とその影響度を調べます。
重回帰分析
エクセル統計の重回帰分析のダイアログを呼び出す前に、青色のフォントのセル範囲を選択後、[Ctrl]キーを押しながら赤色のフォントのセル範囲を選択します。メニューより「エクセル統計」−「多変量解析」−「重回帰分析」を選択します。[理論値を出力する]にチェックを入れて[OK]をクリックします。
基本統計量と相関係数
各変数の基本統計量と変数間の相関係数が出力されます。
重回帰式
- 偏回帰係数:
- 回帰式の係数。今回の分析の場合、回帰式は下記の式で表されます。
- 球速 = 48.069 + 0.711 × 遠投 + 0.376 × 懸垂 + 0.065 × 握力
- 標準偏回帰係数:
- データを標準化して重回帰分析を行った場合の偏回帰係数。
- 各説明変数のデータの大きさの違いが考慮されないので、目的変数への影響度を比較するのに用いることができます。
- t値:
- 帰無仮説「偏回帰係数は0である」の検定統計量。
- P値:
- 帰無仮説「偏回帰係数は0である」の有意確率。
- 標準誤差:
- 偏回帰係数の推定誤差。
- 95%下限:
- 偏回帰係数の95%信頼区間の下限値。
- 95%上限:
- 偏回帰係数の95%信頼区間の上限値。
- P値が0.05より大きい場合、95%信頼区間に0を含みます。
- 単相関:
- 目的変数と各説明変数との間の相関係数。
- 上部で出力されている相関係数と同じ値をとります。
- 偏相関:
- 目的変数と各説明変数との間の偏相関係数。
- トレランス※:
- 説明変数間の多重共線性を検出するための指標。
- トレランスの値が小さい場合はその変数を分析から除いた方がよいとされています。
- 0.1を基準とすることが多いようです。
- VIF(分散拡大要因)※:
- 説明変数間の多重共線性を検出するための指標。
- VIFの値が大きい場合はその変数を分析から除いた方がよいとされています。
- 10を基準とすることが多いようです。
※ エクセル統計2008においてトレランスとVIFの値に誤りが認められたため、Ver1.06(2008年11月5日公開)でこれらの修正を行いました。インターネットアップデートにより最新のバージョンへ更新することでこの修正は適用されます。
精度
- 決定係数:
- 回帰式の当てはまりの良さの尺度。
- 回帰式で説明できた割合を表しているので、大きい方が良い。
- 今回の場合は、総平方和に対して回帰平方和が占める割合が45.4%であることを意味しています。
- 修正済決定係数:
- 説明変数の数が増えるほど決定係数も大きくなってしまうので、説明変数の数を考慮した決定係数が修正済決定係数です。
- 回帰式の評価には修正済決定係数を使うのが良い。
- 重相関係数:
- 目的変数の観測値と理論値との間の相関係数。
- 決定係数の平方根に等しい。
- 修正済重相関係数:
- サンプルサイズに対する説明変数の数の割合が多くなるほど重相関係数の値は過大評価されやすいので、この点を調整した重相関係数のこと。
- ダービン・ワトソン比:
- 誤差項間に自己相関があるかないかを判別するための指標。
- 0以上4以下の値をとり、2前後であれば自己相関なしと判断します。
- 赤池情報量基準(AIC):
- 値が小さいほどモデルのあてはまりが良いことを示します。
- モデル間で相対的に精度を比較するのに用います。
分散分析表
帰無仮説「回帰変動は0である(回帰係数はすべて0である)」を分散分析した結果です。回帰変動が誤差変動に比べて十分大きいかどうかを検定していて、よほどあてはまりが悪い場合以外は帰無仮説は棄却されます。
回帰変動の偏差平方和を全体変動の偏差平方和で割った値が決定係数です。
理論値と残差
目的変数の観測値(元データ)と理論値、およびその残差が出力されます。残差の平方和が、分散分析表の誤差変動の偏差平方和となります。
残差プロット
残差プロットが出力されます。
まとめ
この重回帰式の修正済み決定係数は0.35とあまり高くありません。説明変数「握力」は標準偏回帰係数の値が小さく、P値もかなり大きな値となっているので、説明変数から「握力」を除いて再度重回帰分析を行ってみるのが良いでしょう。
※ 掲載している画像は、エクセル統計による出力後に一部書式設定を行ったものです。
ダウンロード
この解析事例のExcel ファイルのダウンロードはこちらから → example_6.xls
参考書籍
→ トップに戻る
→ 統計解析事例一覧に戻る
→ 重回帰分析についてのコラムへ
→ エクセル統計2008 製品紹介へ
最終更新日:2009.9.14