回帰方程式

この記事では、回帰式とは何なのか、また何に使用されるのかについて説明します。同様に、回帰式を見つける方法、解答済みの演習、そして最後に、任意のデータセットの回帰式を計算するためのオンライン計算機を学習します。

回帰式とは何ですか?

回帰式はドット プロットに最もよく適合する式です。つまり、回帰式はデータ セットの最良の近似です。

回帰方程式は y=β 01 x の形式になります。ここで、β 0は方程式の定数、β 1は方程式の傾きです。

y=\beta_0+\beta_1x

回帰式を見ると直線の方程式になります。これは、線が線形関係を表すため、独立変数 X と従属変数 Y の間の関係が線形関係としてモデル化されることを意味します。

したがって、回帰式を使用すると、データセットの独立変数と従属変数を数学的に関連付けることができます。回帰式は通常、各観測値の値を正確に決定することはできませんが、それでも値の近似値を取得するために使用されます。

回帰方程式

前のグラフでわかるように、回帰式はデータセットの傾向と、独立変数と従属変数の間にどのような種類の関係が存在するかを確認するのに役立ちます。

回帰式の計算方法

単回帰式の係数を計算する式は次のとおりです。

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[12ex]\beta_0=\overline{y}-\beta_1\overline{x}\end{array}

金:

  • \beta_0

    回帰式の定数です。

  • \beta_1

    回帰式の傾きです。

  • x_i

    データ i の独立変数 X の値です。

  • y_i

    データ i の従属変数 Y の値です。

  • \overline{x}

    独立変数の値の平均です

  • \overline{y}

    従属変数 Y の値の平均です。

回帰式の計算例

  • 統計試験を受けた後、5 人の学生が試験に費やした勉強時間について尋ねられました。データは以下の表に示されています。収集した統計データから回帰式を計算し、学習時間と取得した成績を直線的に関連付けます。次に、8時間勉強した生徒が何級を受けるかを決定します。

サンプル データの回帰式を見つけるには、式の係数 b 0と b 1を決定する必要があります。これを行うには、上のセクションで説明した式を使用する必要があります。

ただし、線形回帰式の公式を適用するには、まず独立変数の平均と従属変数の平均を計算する必要があります。

\begin{array}{c}\overline{x}=\cfrac{11+5+10+12+7}{5}=9\\[4ex]\overline{y}=\cfrac{7+4+5+8+6}{5}=6\end{array}

変数の平均がわかったので、対応する式を使用してモデルの係数 β 1を計算します。

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[10ex] \beta_1=\cfrac{\begin{array}{c}(11-9)(7-6)+(5-9)(4-6)+(10-9)(5-6)+\\+(12-9)(8-6)+(7-9)(6-6)\end{array}}{(11-9)^2+(5-9)^2+(10-9)^2+(12-9)^2+(7-9)^2}\\[6ex]\beta_1=0,4412\end{array}

最後に、対応する式を使用してモデルの係数 β 0を計算します。

\begin{array}{l}\beta_0=\overline{y}-\beta_1\overline{x}\\[3ex]\beta_0=6-0,4412\cdot 9 \\[3ex]\beta_0=2,0294\end{array}

つまり、問題の線形回帰直線の方程式は次のとおりです。

y=2,0294+0,4412x

以下に、サンプル データのグラフ表現と単純な線形回帰モデルの方程式を示します。

線形回帰直線の例

回帰式を計算したら、8 時間勉強した生徒が取得する成績を予測するには、この値を結果の回帰式に代入するだけです。

y=2,0294+0,4412\cdot 8=5,56

したがって、実行された線形回帰モデルによると、学生が 8 時間勉強した場合、試験では 5.56 点を獲得します。

回帰式計算機

回帰式を計算するには、サンプル データを以下の計算機に入力します。最初のボックスには独立変数 X の値のみが含まれ、2 番目のボックスには従属変数 Y の値のみが含まれるように、データのペアを分離する必要があります。

データはスペースで区切られ、小数点としてピリオドを使用して入力する必要があります。

  • 独立変数

  • 従属変数 Y:

重回帰式

単純な線形回帰方程式が何であるかを見てきましたが、回帰モデルは 2 つ以上の独立変数を含む重線形回帰モデルにすることもできます。したがって、多重線形回帰により、いくつかの説明変数を応答変数に線形的にリンクすることができます。

重線形回帰モデルの方程式は次のとおりです。

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

金:

  • y

    は従属変数です。

  • x_i

    は独立変数 i です。

  • \beta_0

    重回帰式の定数です。

  • \beta_i

    変数に関連付けられた回帰係数です

    x_i

  • \bm{\varepsilon}

    誤差または残差、つまり観測値とモデルによって推定された値の差です。

  • m

    はモデル内の変数の総数です。

したがって、合計が含まれるサンプルがある場合、

n

観察結果を基に、行列形式で重線形回帰モデルを立てることができます。

\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}

上記の行列式は、各行列に文字を割り当てることで書き換えることができます。

Y=X\beta+\varepsilon

したがって、最小二乗基準を適用すると、重回帰式の係数を推定するための式に到達できます。

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

ただし、この公式の適用は非常に手間と時間がかかるため、実際には、重回帰モデルをより迅速に作成できるコンピューター ソフトウェア (Minitab や Excel など) を使用することをお勧めします。

「多重線形回帰とは何ですか?」を参照してください。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です