단순 선형 회귀

이 기사에서는 통계에서 단순 선형 회귀가 무엇인지, 그리고 어떻게 수행되는지 설명합니다. 마찬가지로, 간단한 선형 회귀 문제를 해결하고 간단한 선형 회귀 계산기도 온라인에서 찾을 수 있습니다.

단순 선형 회귀란 무엇입니까?

단순 선형 회귀는 독립 변수를 연관시키는 데 사용되는 통계 모델이며 두 변수 사이에 어떤 관계가 있는지 근사화하려고 합니다.

따라서 두 변수를 선형적으로 연관시키는 방정식을 찾기 위해 단순선형회귀를 사용합니다. 논리적으로 두 변수 간의 관계는 선형이어야 하며, 그렇지 않으면 다른 유형의 회귀 모델을 사용해야 합니다.

단순 선형 회귀 모델의 방정식은 방정식의 상수(b 0 )와 두 변수 사이의 상관 계수(b 1 )라는 두 가지 계수로 구성됩니다. 따라서 단순 선형 회귀 모델의 방정식은 y=b 0 +b 1 x입니다.

y=b_0+b_1x

단순 선형 회귀 방정식은 직선으로 그래프로 표시되므로 계수 b 0 은 절편이고 계수 b 1 은 선의 기울기입니다.

단순 선형 회귀 공식

단순 선형 회귀의 계수를 계산하는 공식은 다음과 같습니다.

단순 선형 회귀 공식

👉 아래 계산기를 사용하여 모든 데이터 세트에 대한 단순 선형 회귀 계수를 계산할 수 있습니다.

분명히 단순 선형 회귀 모델에서 나온 방정식은 모든 관측치의 정확한 값을 추측할 수 없을 것입니다. 왜냐하면 이 모델은 단순히 두 변수 간의 관계를 근사화하는 방정식을 찾으려고 시도하기 때문입니다. 따라서 잔차는 실제 값과 선형 회귀 모델에 의해 추정된 값의 차이로 정의됩니다.

e_i=y_i-\widehat{y}_i

단순 선형 회귀 모델의 목표는 잔차의 제곱을 최소화하는 것입니다. 즉, 단순 선형 회귀는 최소 제곱 기준을 기반으로 합니다.

단순 선형 회귀의 구체적인 예

단순 선형 회귀 방법에 대한 이해를 마무리하기 위해 다음은 일련의 통계 데이터로부터 단순 선형 회귀 모델의 방정식을 계산하는 실제 단계별 예제입니다.

  • 통계 시험을 치른 후 5명의 학생에게 시험에 얼마나 많은 시간을 공부했는지 질문했습니다. 데이터는 아래 표에 나와 있습니다. 수집된 통계 데이터의 간단한 선형 회귀 모델을 수행하여 학습 시간과 달성한 성적을 선형적으로 연결합니다.

간단한 선형 회귀 모델을 수행하려면 방정식의 계수 b 0 및 b 1 을 결정해야 하며 이를 위해 위 섹션에 표시된 공식을 사용해야 합니다.

그러나 단순 선형 회귀 공식을 적용하려면 먼저 독립 변수의 평균과 종속 변수의 평균을 계산해야 합니다.

\begin{array}{c}\overline{x}=\cfrac{11+5+10+12+7}{5}=9\\[4ex]\overline{y}=\cfrac{7+4+5+8+6}{5}=6\end{array}

이제 변수의 평균을 알았으므로 해당 공식을 사용하여 모델의 계수 b 1 을 계산합니다.

\begin{array}{c}b_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[10ex] b_1=\cfrac{\begin{array}{c}(11-9)(7-6)+(5-9)(4-6)+(10-9)(5-6)+\\+(12-9)(8-6)+(7-9)(6-6)\end{array}}{(11-9)^2+(5-9)^2+(10-9)^2+(12-9)^2+(7-9)^2}\\[6ex]b_1=0,4412\end{array}

마지막으로 해당 공식을 사용하여 모델의 계수 b0 를 계산합니다.

\begin{array}{l}b_0=\overline{y}-b_1\overline{x}\\[3ex]b_0=6-0,4412\cdot 9 \\[3ex]b_0=2,0294\end{array}

즉, 문제의 단순 선형 회귀 모델에 대한 방정식은 다음과 같습니다.

y=2,0294+0,4412x

아래에서는 샘플 데이터의 그래픽 표현과 단순 선형 회귀 모델의 직선을 볼 수 있습니다.

단순 선형 회귀 예제

마지막으로 단순선형회귀모델의 방정식을 계산했다면 이제 얻은 결과를 해석하는 일만 남았다. 이를 위해서는 회귀 모델의 결정 계수를 계산하는 것이 필수적입니다. 당사 웹사이트에서 해당 기사를 검색하면 이것이 어떻게 수행되는지 확인할 수 있습니다.

단순 선형 회귀 가정

단순 선형 회귀를 수행하려면 다음 가정이 충족되어야 합니다.

  • 독립성 : 관찰된 잔기는 서로 독립이어야 합니다. 모델 독립성을 보장하는 일반적인 방법은 샘플링 프로세스에 무작위성을 추가하는 것입니다.
  • 동분산성(homoscedasticity) : 잔차의 분산에는 동질성이 있어야 합니다. 즉, 잔차의 변동성이 일정해야 합니다.
  • 정규성 : 잔차는 정규 분포를 따라야 합니다. 즉, 평균이 0인 정규 분포를 따라야 합니다.
  • 선형성 – 독립변수와 종속변수 사이의 관계는 선형이어야 합니다.

단순 선형 회귀 계산기

두 변수 사이의 단순 선형 회귀 모델을 맞추려면 샘플 데이터를 아래 계산기에 연결하세요. 첫 번째 상자에는 독립변수 X의 값만 있고 두 번째 상자에는 종속변수 Y의 값만 있도록 데이터 쌍을 분리해야 합니다.

데이터는 공백으로 구분해야 하며 소수점 구분 기호로 마침표를 사용하여 입력해야 합니다.

  • 독립 변수

  • 종속변수 Y:

단순 및 다중 선형 회귀

마지막으로 단순 선형 회귀와 다중 선형 회귀는 통계에서 자주 사용되는 선형 회귀의 두 가지 유형이므로 차이점이 무엇인지 살펴보겠습니다.

다중 선형 회귀를 사용하면 두 개 이상의 설명 변수를 반응 변수에 수학적으로 연결할 수 있습니다. 즉, 다중선형회귀에서는 최소 2개의 독립변수가 존재하는 모형이 생성된다.

따라서 단순선형회귀와 다중선형회귀의 차이는 독립변수의 개수에 있습니다. 단순선형회귀에는 독립변수가 하나뿐인 반면, 다중선형회귀에는 독립변수가 2개 이상 존재한다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다