회귀선

이 기사에서는 통계에서 회귀선이 무엇인지 설명합니다. 따라서 두 변수 사이의 회귀선을 계산하는 방법, 해결된 연습 문제 및 추가로 데이터 샘플에 대한 회귀선을 계산하는 온라인 계산기를 찾을 수 있습니다.

회귀선은 무엇입니까?

통계에서 회귀선은 단순 선형 회귀 모델 에서 얻은 선입니다. 보다 정확하게 말하면 회귀선은 산점도에 가장 잘 맞는 선이므로 일련의 통계 데이터를 가장 잘 설명합니다.

따라서 회귀선 방정식은 데이터 세트의 독립 변수 X와 종속 변수 Y를 수학적으로 연관시킵니다. 회귀선은 일반적으로 각 관측치의 값을 정확하게 결정할 수는 없지만 대략적인 값을 제공할 수 있습니다.

회귀선

이전 그래프에서 볼 수 있듯이 회귀선은 데이터 세트의 추세와 독립 변수와 종속 변수 사이에 어떤 유형의 관계가 존재하는지 확인하는 데 도움이 됩니다. 아래에서는 회귀선의 적용을 살펴보겠습니다.

회귀선 수식

이제 회귀선의 정의를 알았으니 선형 회귀 모델의 선 방정식을 계산하는 방법을 살펴보겠습니다.

다른 선과 마찬가지로 회귀선의 방정식은 상수(b 0 )와 기울기(b 1 )로 구성됩니다.

y=b_0+b_1x

따라서 선형 회귀선의 계수를 계산하는 공식은 다음과 같습니다.

\begin{array}{c}b_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[12ex]b_0=\overline{y}-b_1\overline{x}\end{array}

금:

  • b_0

    회귀선의 상수입니다.

  • b_1

    회귀선의 기울기입니다.

  • x_i

    데이터 i의 독립변수 X의 값입니다.

  • y_i

    데이터 i의 종속변수 Y의 값입니다.

  • \overline{x}

    독립 변수 값의 평균입니다.

  • \overline{y}

    종속 변수 Y 값의 평균입니다.

👉 아래 계산기를 사용하여 모든 데이터 세트에 대한 회귀선을 계산할 수 있습니다.

회귀선의 구체적인 예

회귀선의 개념을 더 자세히 살펴보기 위해 회귀선을 만드는 방법에 대한 예제가 아래에 나와 있습니다.

  • 통계 시험을 치른 후 5명의 학생에게 시험에 몇 시간을 공부했는지 물었고 그 데이터는 아래 표에 나와 있습니다. 수집된 통계 데이터로부터 회귀선을 계산하여 학습 시간과 획득한 성적을 선형적으로 연관시킵니다. 다음으로, 8시간 공부한 학생이 어떤 성적을 받을지 결정합니다.

샘플 데이터에 대한 회귀선을 찾으려면 방정식의 계수 b 0 및 b 1 을 결정해야 하며 이를 위해 위 섹션에 표시된 공식을 사용해야 합니다.

그러나 선형 회귀선에 대한 공식을 적용하려면 먼저 독립 변수의 평균과 종속 변수의 평균을 계산해야 합니다.

\begin{array}{c}\overline{x}=\cfrac{11+5+10+12+7}{5}=9\\[4ex]\overline{y}=\cfrac{7+4+5+8+6}{5}=6\end{array}

이제 변수의 평균을 알았으므로 해당 공식을 사용하여 모델의 계수 b 1 을 계산합니다.

\begin{array}{c}b_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[10ex] b_1=\cfrac{\begin{array}{c}(11-9)(7-6)+(5-9)(4-6)+(10-9)(5-6)+\\+(12-9)(8-6)+(7-9)(6-6)\end{array}}{(11-9)^2+(5-9)^2+(10-9)^2+(12-9)^2+(7-9)^2}\\[6ex]b_1=0,4412\end{array}

마지막으로 해당 공식을 사용하여 모델의 계수 b0 를 계산합니다.

\begin{array}{l}b_0=\overline{y}-b_1\overline{x}\\[3ex]b_0=6-0,4412\cdot 9 \\[3ex]b_0=2,0294\end{array}

간단히 말하면, 문제의 선형회귀선의 방정식은 다음과 같습니다.

y=2,0294+0,4412x

아래에서는 샘플 데이터의 그래픽 표현과 단순 선형 회귀 모델의 직선을 볼 수 있습니다.

선형 회귀선 예

회귀선을 계산한 후 8시간 공부한 학생이 얻을 성적을 예측하려면 이 값을 얻은 회귀선 방정식에 대입하면 됩니다.

y=2,0294+0,4412\cdot 8=5,56

따라서 수행된 선형 회귀 모델에 따르면 학생이 8시간 동안 공부했다면 시험에서 5.56점을 얻게 됩니다.

회귀선은 무엇에 사용되나요?

주로 회귀선에는 두 가지 용도가 있습니다. 회귀선은 두 변수 사이에 어떤 유형의 관계가 존재하는지 결정하는 데 사용되며, 다른 한편으로는 회귀선을 사용하면 새 관찰 값에 대한 예측을 할 수도 있습니다.

회귀선의 기울기는 독립변수와 종속변수 사이의 상관관계가 어떤지 알려줍니다. 기울기가 양수이면 종속변수가 독립변수에 정비례한다는 의미이고, 기울기가 음수이면 변수가 반비례한다는 의미입니다. 마지막으로, 기울기 계수가 0에 매우 가까우면 이는 두 변수 간의 상관 관계가 매우 약하다는 것을 의미합니다.

또한 회귀선의 방정식을 알고 있으면 위의 예에서와 같이 종속변수의 값이 독립변수의 새로운 값에 대해 예측될 수 있습니다. 따라서 회귀선이 더 잘 조정될수록 예측이 더 좋아집니다.

회귀선 계산기

두 변수 사이의 회귀선을 계산하려면 다음 계산기에 데이터 샘플을 입력하십시오. 첫 번째 상자에는 독립변수 X의 값만 있고 두 번째 상자에는 종속변수 Y의 값만 있도록 데이터 쌍을 분리해야 합니다.

데이터는 공백으로 구분해야 하며 소수점 구분 기호로 마침표를 사용하여 입력해야 합니다.

  • 독립 변수

  • 종속변수 Y:

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다