Excelで二次回帰を実行する方法


回帰は、1 つ以上の予測変数と応答変数の間の関係を説明するために使用できる統計手法です。最も一般的なタイプの回帰は線形回帰です。これは、予測変数と応答変数の間の関係が線形である場合に使用されます。

言い換えれば、予測変数が増加すると、応答変数も同様に増加する傾向があります。たとえば、線形回帰モデルを使用して、学習時間数 (予測変数) と学生が試験で受け取る成績 (応答変数) の関係を記述することができます。

ただし、予測変数と応答変数の間の関係が非線形になる場合があります。一般的なタイプの非線形関係は2 次関係で、グラフ上では U または逆さまの U のように見えます。

つまり、予測変数が増加すると、応答変数も増加する傾向がありますが、ある点を超えると、予測変数が増加し続けるため、応答変数は減少し始めます。

たとえば、二次回帰モデルを使用して、労働に費やした時間数と個人が報告する幸福度の関係を説明できます。おそらく、人は働けば働くほど充実感を感じるでしょうが、一定の閾値に達すると、実際には仕事が増えるとストレスが生じ、幸福度が低下します。この場合、二次回帰モデルは線形回帰モデルよりもデータによく適合します。

Excel で二次回帰を実行する方法の例を確認してみましょう。

Excel での二次回帰

16 人の異なる人々について、週あたりの労働時間数と報告された幸福度 (0 ~ 100 のスケール) に関するデータがあるとします。

まず、散布図を作成して、線形回帰がデータに適合する適切なモデルであるかどうかを確認しましょう。

セルA2:B17を強調表示します。次に、上部のリボンに沿って [挿入] タブをクリックし、 [グラフ]領域で[散布]をクリックします。これにより、データの散布図が生成されます。

労働時間と報告された幸福感との関係が直線的ではないことは簡単にわかります。実際、これは「U」字型をたどるため、二次回帰の完璧な候補になります。

二次回帰モデルをデータに適合させる前に、予測子変数の二乗値用の新しい列を作成する必要があります。

まず、列 B のすべての値を強調表示し、列 C にドラッグします。

次に、セル B2 に数式=A2^2を入力します。これにより、値36が生成されます。次に、セル B2 の右下隅をクリックし、数式を下にドラッグして列 B の残りのセルを埋めます。

次に、二次回帰モデルを当てはめます。

上部のリボンに沿って「データ」をクリックし、右端にある「データ分析」オプションをクリックします。このオプションが表示されない場合は、まず無料の Analysis ToolPak ソフトウェアをインストールする必要があります。

[データ分析]をクリックすると、ボックスが表示されます。 [回帰]をクリックし、 [OK]をクリックします。

次に、表示される「回帰」ボックスに次の値を入力します。次に、 「OK」をクリックします。

次の結果が表示されます。

出力内のさまざまな数値を解釈する方法は次のとおりです。

R 二乗:決定係数とも呼ばれ、予測変数によって説明できる応答変数の分散の割合です。この例では、R 二乗は0.9092であり、報告された幸福度レベルの分散の 90.92% が労働時間数と労働時間数 ^ 2 によって説明できることを示しています。

標準誤差:回帰の標準誤差は、観測値と回帰直線の間の平均距離です。この例では、観測値は回帰直線から平均して9,519 単位外れています。

F 統計量: F 統計量は、回帰 MS/残差 MS として計算されます。この統計は、回帰モデルが独立変数を含まないモデルよりもデータによく適合するかどうかを示します。基本的に、回帰モデル全体が有用かどうかをテストします。一般に、モデル内の予測変数が統計的に有意でない場合、全体の F 統計も統計的に有意ではありません。この例では、F 統計量は65.09で、対応する p 値は <0.0001 です。この p 値は 0.05 未満であるため、回帰モデル全体としては有意です。

回帰係数:最後の表の回帰係数は、推定された回帰式を書くために必要な数値を示します。

yハット= b 0 + b 1 x 1 + b 2 x 1 2

この例では、推定される回帰式は次のようになります。

宣言された幸福度 = -30.252 + 7.173 (労働時間) -0.106 (労働時間) 2

この方程式を使用して、労働時間に基づいて個人の期待される幸福度を計算できます。たとえば、週に 30 時間働く人の期待される幸福度は次のとおりです。

報告された幸福度 = -30.252 + 7.173(30) -0.106(30) 2 = 88.649

追加リソース

Excelで二次近似曲線を追加する方法
回帰表の見方と解釈方法

適切な R 二乗値はどれくらいですか?
回帰の標準誤差を理解する
回帰における全体的な有意性の F 検定を理解するための簡単なガイド

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です