【Excel】エクセルでの回帰分析・重回帰分析のやり方(相関分析・分散分析・統計解析の方法も)
データ分析の現場では、変数間の関係性を明らかにしたいという場面が多く訪れます。
Excelには、回帰分析・重回帰分析・相関分析・分散分析といった統計解析機能が標準で備わっており、専門的なソフトを使わなくても本格的なデータ分析が行えます。
しかし「どこから操作すればいいのかわからない」「分析結果の見方が難しい」と感じている方も多いのではないでしょうか。
この記事では、Excelを使った統計解析の基本から実践的なやり方まで、わかりやすく丁寧に解説していきます。
初めてチャレンジする方でも安心して進められるよう、手順を一つひとつ確認していきましょう。
Excelの回帰分析・重回帰分析は「データ分析ツール」を使えばできる
それではまず、Excelで回帰分析・重回帰分析を行うための大前提となる「データ分析ツール」について解説していきます。
Excelには「分析ツール」と呼ばれるアドインが用意されており、これを有効化することで回帰分析・重回帰分析・相関分析・分散分析などの統計解析が一括で利用できるようになります。
Excelの統計解析は、アドイン「データ分析ツール」を有効にすることが最初の必須ステップです。
このアドインを使えば、関数の知識がなくてもメニュー操作だけで本格的な分析が行えます。
データ分析ツールのアドイン有効化の手順
まずはデータ分析ツールをExcelに追加する方法を確認しましょう。
操作はとてもシンプルで、以下の手順で進めていきます。
①「ファイル」タブをクリック
②「オプション」を選択
③「アドイン」をクリックし、「管理」ボックスで「Excelアドイン」を選択して「設定」をクリック
④「分析ツール」にチェックを入れて「OK」をクリック
これで「データ」タブの中に「データ分析」ボタンが表示されるようになります。
もし「分析ツール」が一覧に表示されていない場合は、Officeのインストール状態を確認してみましょう。
データ分析ツールで使える主な統計解析の種類
データ分析ツールには、回帰分析以外にもさまざまな統計解析機能が含まれています。
主なものをまとめると以下の通りです。
| 分析の種類 | 概要 |
|---|---|
| 回帰分析 | 1つの目的変数と1つの説明変数の関係を分析 |
| 重回帰分析 | 1つの目的変数と複数の説明変数の関係を分析 |
| 相関分析 | 2つ以上の変数間の相関関係を数値で表す |
| 分散分析(一元配置) | グループ間の平均に差があるかを検定 |
| t検定 | 2グループの平均値の差を統計的に検定 |
| 記述統計 | 平均・標準偏差・最大値などの基本統計量を算出 |
このように、一つのツールで多様な統計解析が行えるのがExcelの大きな強みです。
分析前に整えておきたいデータの形式
統計解析を正確に行うためには、データの形式を事前に整えておくことが重要です。
基本的なルールを押さえておきましょう。
・1行目は変数名(列ヘッダー)を記入する
・2行目以降にデータを縦方向に並べる
・空白セルや文字列の混入はエラーの原因になるため除去する
・各列が1つの変数(説明変数・目的変数)に対応するよう整理する
データが整理されていると、分析結果の精度も上がります。
面倒に感じるかもしれませんが、この準備が分析の成否を左右する重要なポイントです。
Excelで回帰分析・重回帰分析を実行する具体的な手順
続いては、実際にExcelで回帰分析・重回帰分析を実行するやり方を確認していきます。
回帰分析とは、ある変数(説明変数)が別の変数(目的変数)にどのような影響を与えているかを数式で表す分析手法です。
例えば「気温」が「アイスの売上」に与える影響を調べたい場合などに活用されます。
単回帰分析の実行手順
単回帰分析とは、説明変数が1つの回帰分析のことです。
以下の手順で操作を進めましょう。
①「データ」タブ →「データ分析」をクリック
②「回帰分析」を選択して「OK」をクリック
③「入力Y範囲」に目的変数(例:売上)のセル範囲を入力
④「入力X範囲」に説明変数(例:気温)のセル範囲を入力
⑤「ラベル」にチェックを入れ(見出し行を含める場合)、出力先を指定して「OK」
これで回帰分析の結果が新しいシートまたは指定のセル範囲に出力されます。
出力された結果の中で特に注目すべき指標については後ほど詳しく解説します。
重回帰分析の実行手順と注意点
重回帰分析では、説明変数が複数になります。
例えば「気温」「曜日」「広告費」の3つの変数で「売上」を予測するようなケースです。
①「データ分析」→「回帰分析」を選択(単回帰と同じメニューを使用)
②「入力Y範囲」に目的変数(売上など)を指定
③「入力X範囲」に複数の説明変数をまとめて選択(列が隣接している必要あり)
④「ラベル」「有意水準」などを確認して「OK」をクリック
重回帰分析では、説明変数の列が連続して並んでいる必要がある点に注意が必要です。
離れた列を使いたい場合は、事前にデータを並べ替えておきましょう。
回帰分析の出力結果の見方
分析が完了すると、以下のような結果が出力されます。
主要な指標の意味を理解しておくことで、分析結果を正しく読み取れるようになります。
| 出力項目 | 意味 | 目安 |
|---|---|---|
| 重決定R²(決定係数) | モデルの当てはまりの良さ | 1に近いほど良い |
| 補正R² | 説明変数の数を考慮した決定係数 | 重回帰で参照 |
| 有意F | モデル全体の統計的有意性 | 0.05未満が目安 |
| 係数 | 説明変数の目的変数への影響量 | 符号と大きさに注目 |
| P値 | 各係数の統計的有意性 | 0.05未満で有意 |
決定係数(R²)が0.7以上であれば、モデルの説明力が高いと判断される傾向があります。
ただし、数値の目安は分野や目的によって異なるため、参考値として活用してみてください。
Excelで相関分析・分散分析を行う方法
続いては、回帰分析と合わせてよく使われる相関分析と分散分析の方法を確認していきます。
この2つを組み合わせることで、データの関係性をより多角的に把握することができます。
相関分析のやり方と相関係数の見方
相関分析とは、2つの変数の間にどの程度の関係があるかを「相関係数」という数値で表す手法です。
Excelでの操作手順は以下の通りです。
①「データ」タブ →「データ分析」をクリック
②「相関」を選択して「OK」をクリック
③「入力範囲」に分析したい変数の列をすべて選択
④「先頭行をラベルとして使用」にチェックし、出力先を指定して「OK」
出力された相関行列を見ると、各変数ペアの相関係数が確認できます。
| 相関係数の値 | 相関の強さ |
|---|---|
| 0.7 〜 1.0 | 強い正の相関 |
| 0.4 〜 0.7 | 中程度の正の相関 |
| 0.0 〜 0.4 | 弱い正の相関 |
| -0.4 〜 0.0 | 弱い負の相関 |
| -0.7 〜 -0.4 | 中程度の負の相関 |
| -1.0 〜 -0.7 | 強い負の相関 |
なお、CORREL関数を使うと、2変数間の相関係数を手軽に算出することも可能です。
=CORREL(変数Aの範囲, 変数Bの範囲)
分散分析(一元配置)のやり方
分散分析(ANOVA)とは、複数のグループ間で平均値に統計的に有意な差があるかを検定する手法です。
例えば「3つの販売地域で売上に差があるか」を調べる場面などに活用されます。
①「データ分析」→「分散分析:一元配置」を選択
②「入力範囲」に各グループのデータ列を選択
③「データ方向」「有意水準(通常0.05)」を設定して「OK」をクリック
出力結果の中の「P値」が0.05未満であれば、グループ間に統計的に有意な差があると判断できます。
この結果は「帰無仮説(差がない)を棄却できる」という解釈になります。
相関分析と回帰分析の違いを理解しよう
相関分析と回帰分析は似ているように見えて、目的が異なります。
混同しやすいため、ここで整理しておきましょう。
| 分析手法 | 目的 | 出力される値 |
|---|---|---|
| 相関分析 | 変数間の関係の強さを調べる | 相関係数(-1〜1) |
| 回帰分析 | 一方の変数からもう一方を予測する式を作る | 回帰式・係数・決定係数など |
相関分析は「関係があるかどうか」を確認するものであり、因果関係を示すものではない点に注意が必要です。
回帰分析は予測モデルの構築に適しており、実務での活用シーンも非常に多い手法です。
Excel統計解析をより深く活用するためのポイント
続いては、Excelの統計解析をより実践的・効果的に活用するためのポイントを確認していきます。
基本的な操作を習得したあとは、分析の精度を上げる工夫を取り入れることで、より信頼性の高い結果が得られるようになります。
多重共線性に注意した重回帰分析のコツ
重回帰分析において注意すべき問題の一つが「多重共線性」です。
これは、説明変数同士が強く相関している場合に発生し、回帰係数の推定が不安定になる現象です。
重回帰分析では、説明変数間の相関係数が0.8以上になっている場合、多重共線性のリスクが高まります。
事前に相関分析を行い、高い相関のある変数は一方を除くなどの対処が必要です。
また、変数を増やせばR²は必ず上昇しますが、それが真に意味のあるモデルかどうかは別の話です。
「補正R²(自由度調整済みR²)」を確認することで、説明変数の数の影響を除いた精度が評価できます。
散布図・近似曲線を使った視覚的な分析
Excelでは、数値だけでなくグラフを活用することで回帰の関係性を視覚的に確認できます。
散布図と近似曲線(回帰直線)を追加する手順は以下の通りです。
①データを選択して「挿入」→「散布図」を作成
②グラフ上のデータ点を右クリック →「近似曲線の追加」を選択
③「線形近似」を選び、「グラフに数式を表示する」「グラフにR²を表示する」にチェック
これにより、グラフ上に回帰直線の数式とR²が表示されます。
視覚的にデータの傾向を把握できるため、プレゼンや報告書での使用にも非常に効果的です。
FORECAST関数・LINEST関数との組み合わせ活用
データ分析ツールを使わなくても、関数を使って回帰分析に関連する計算が行えます。
代表的な関数を紹介します。
| 関数名 | 機能 |
|---|---|
| FORECAST.LINEAR | 線形回帰に基づいて予測値を算出する |
| LINEST | 回帰係数・切片・統計値などを配列で返す |
| SLOPE | 回帰直線の傾き(回帰係数)を返す |
| INTERCEPT | 回帰直線の切片を返す |
| RSQ | 決定係数(R²)を返す |
例えばFORECAST.LINEAR関数を使えば、新しいX値に対する予測Yの値を一瞬で計算できます。
=FORECAST.LINEAR(予測したいXの値, 既知のYの範囲, 既知のXの範囲)
データ分析ツールと関数を組み合わせることで、より柔軟で効率的な統計解析が実現します。
まとめ エクセルでの重回帰分析の方法(できない・分散分析・相関分析・統計解析の方法も)
今回は「【Excel】エクセルでの回帰分析・重回帰分析のやり方(相関分析・分散分析・統計解析の方法も)」と題して、Excelを使った統計解析の基本から実践的な活用方法まで幅広く解説しました。
まず「データ分析ツール」のアドインを有効化することが、すべての出発点となります。
回帰分析・重回帰分析は同じメニューから操作でき、説明変数の数によって使い分ける形です。
相関分析では変数間の関係の強さを相関係数で把握でき、分散分析ではグループ間の差の有無を検定できます。
決定係数やP値、多重共線性など、結果の見方を理解することが正しい分析の鍵を握っています。
さらに散布図や近似曲線、LINEST関数などを組み合わせることで、分析の幅はぐっと広がります。
Excelはビジネスの現場で最もよく使われるツールの一つであり、統計解析の機能を使いこなすことで、データに基づいた意思決定がよりスムーズに行えるようになります。
ぜひこの記事を参考に、実際のデータで分析にチャレンジしてみてください。