회귀 방정식

이 기사에서는 회귀 방정식이 무엇인지, 그리고 어떤 용도로 사용되는지 설명합니다. 마찬가지로 회귀 방정식, 해결된 연습 문제 및 마지막으로 모든 데이터 세트에 대한 회귀 방정식을 계산하는 온라인 계산기를 찾는 방법을 배우게 됩니다.

회귀 방정식은 무엇입니까?

회귀 방정식은 도트 플롯에 가장 잘 맞는 방정식입니다. 즉, 회귀 방정식은 데이터 집합에 대한 가장 좋은 근사치입니다.

회귀 방정식은 y=β 01 x 형식입니다. 여기서 β 0 은 방정식의 상수이고 β 1 은 방정식의 기울기입니다.

y=\beta_0+\beta_1x

회귀식을 보면 직선의 방정식이다. 이는 선이 선형 관계를 나타내므로 독립 변수 X와 종속 변수 Y 간의 관계가 선형 관계로 모델링됨을 의미합니다.

따라서 회귀 방정식을 사용하면 데이터 세트의 독립 변수와 종속 변수를 수학적으로 연관시킬 수 있습니다. 회귀 방정식은 일반적으로 각 관측값의 값을 정확하게 결정할 수 없지만 그럼에도 불구하고 해당 값의 근사치를 얻는 데 사용됩니다.

회귀 방정식

이전 차트에서 볼 수 있듯이 회귀 방정식은 데이터 세트의 추세와 독립 변수와 종속 변수 사이에 어떤 유형의 관계가 존재하는지 확인하는 데 도움이 됩니다.

회귀 방정식을 계산하는 방법

단순선형회귀식의 계수를 계산하는 공식은 다음과 같습니다.

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[12ex]\beta_0=\overline{y}-\beta_1\overline{x}\end{array}

금:

  • \beta_0

    회귀 방정식의 상수입니다.

  • \beta_1

    회귀 방정식의 기울기입니다.

  • x_i

    데이터 i의 독립변수 X의 값입니다.

  • y_i

    데이터 i의 종속변수 Y의 값입니다.

  • \overline{x}

    독립 변수 값의 평균입니다.

  • \overline{y}

    종속 변수 Y 값의 평균입니다.

회귀 방정식 계산의 예

  • 통계 시험을 치른 후 5명의 학생에게 시험에 몇 시간을 공부했는지 물었고 그 데이터는 아래 표에 나와 있습니다. 수집된 통계 데이터로부터 회귀 방정식을 계산하여 학습 시간과 획득한 성적을 선형적으로 연관시킵니다. 다음으로, 8시간 공부한 학생이 어떤 성적을 받을지 결정합니다.

샘플 데이터에 대한 회귀 방정식을 찾으려면 방정식의 계수 b 0 및 b 1 을 결정해야 하며 이를 위해 위 섹션에 표시된 공식을 사용해야 합니다.

그러나 선형 회귀 방정식의 공식을 적용하려면 먼저 독립 변수의 평균과 종속 변수의 평균을 계산해야 합니다.

\begin{array}{c}\overline{x}=\cfrac{11+5+10+12+7}{5}=9\\[4ex]\overline{y}=\cfrac{7+4+5+8+6}{5}=6\end{array}

이제 변수의 평균을 알았으므로 해당 공식을 사용하여 모델의 계수 β 1 을 계산합니다.

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[10ex] \beta_1=\cfrac{\begin{array}{c}(11-9)(7-6)+(5-9)(4-6)+(10-9)(5-6)+\\+(12-9)(8-6)+(7-9)(6-6)\end{array}}{(11-9)^2+(5-9)^2+(10-9)^2+(12-9)^2+(7-9)^2}\\[6ex]\beta_1=0,4412\end{array}

마지막으로 해당 공식을 사용하여 모델의 계수 β 0 을 계산합니다.

\begin{array}{l}\beta_0=\overline{y}-\beta_1\overline{x}\\[3ex]\beta_0=6-0,4412\cdot 9 \\[3ex]\beta_0=2,0294\end{array}

간단히 말하면, 문제의 선형회귀선의 방정식은 다음과 같습니다.

y=2,0294+0,4412x

아래에서는 간단한 선형 회귀 모델 방정식과 함께 샘플 데이터의 그래픽 표현을 볼 수 있습니다.

선형 회귀선 예

회귀 방정식을 계산한 후 8시간 공부한 학생이 얻을 성적을 예측하려면 이 값을 결과 회귀 방정식에 대입하면 됩니다.

y=2,0294+0,4412\cdot 8=5,56

따라서 수행된 선형 회귀 모델에 따르면 학생이 8시간 동안 공부했다면 시험에서 5.56점을 얻게 됩니다.

회귀 방정식 계산기

회귀 방정식을 계산하려면 아래 계산기에 샘플 데이터를 연결하세요. 첫 번째 상자에는 독립변수 X의 값만 있고 두 번째 상자에는 종속변수 Y의 값만 있도록 데이터 쌍을 분리해야 합니다.

데이터는 공백으로 구분해야 하며 소수점 구분 기호로 마침표를 사용하여 입력해야 합니다.

  • 독립 변수

  • 종속변수 Y:

다중 선형 회귀 방정식

우리는 단순 선형 회귀 방정식이 무엇인지 살펴보았습니다. 그러나 회귀 모델은 두 개 이상의 독립 변수를 포함하는 다중 선형 회귀 모델일 수도 있습니다. 따라서 다중 선형 회귀를 사용하면 여러 설명 변수를 응답 변수에 선형적으로 연결할 수 있습니다.

다중 선형 회귀 모델의 방정식은 다음과 같습니다.

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

금:

  • y

    종속변수입니다.

  • x_i

    는 독립변수 i입니다.

  • \beta_0

    다중 선형 회귀 방정식의 상수입니다.

  • \beta_i

    변수와 관련된 회귀 계수입니다.

    x_i

    .

  • \bm{\varepsilon}

    오류 또는 잔차, 즉 관측된 값과 모델에 의해 추정된 값 간의 차이입니다.

  • m

    모델의 총 변수 수입니다.

따라서 총 샘플이 있는 경우

n

관찰을 통해 다중 선형 회귀 모델을 행렬 형식으로 만들 수 있습니다.

\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}

위의 행렬 표현식은 각 행렬에 문자를 할당하여 다시 작성할 수 있습니다.

Y=X\beta+\varepsilon

따라서 최소 제곱 기준을 적용하면 다중 선형 회귀 방정식의 계수를 추정하는 공식 에 도달할 수 있습니다.

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

그러나 이 공식을 적용하는 것은 매우 힘들고 시간이 많이 걸리기 때문에 실제로는 다중 회귀 모델을 훨씬 더 빠르게 생성할 수 있는 컴퓨터 소프트웨어(예: Minitab 또는 Excel)를 사용하는 것이 좋습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다