원점을 통한 회귀: 정의 및 예


단순 선형 회귀는 하나 이상의 예측 변수와 반응 변수 간의 관계를 수량화하는 데 사용할 수 있는 방법입니다.

단순 선형 회귀 모델은 다음과 같은 형식을 취합니다.

y = β 0 + β 1 x

금:

  • y : 응답 변수의 값
  • β 0 : x = 0일 때 반응 변수의 값(“절편” 항이라고 함)
  • β 1 : x의 1단위 증가와 관련된 반응 변수의 평균 증가
  • x : 예측변수의 값

이 모델의 수정된 버전은 원점을 통한 회귀 로 알려져 있으며, x가 0일 때 y를 0과 동일하게 만듭니다.

이 유형의 모델은 다음과 같은 형식을 취합니다.

y = β1x

절편 항이 모델에서 완전히 제거되었습니다.

이 모델은 예측 변수가 0일 때 반응 변수도 0이어야 한다는 것을 연구자가 알고 있을 때 때때로 사용됩니다.

현실 세계에서는 이러한 유형의 모델이 임업이나 생태학 연구 에서 가장 자주 사용됩니다.

예를 들어, 연구자들은 나무 둘레를 사용하여 나무 높이를 예측할 수 있습니다. 주어진 나무의 원주가 0이면 높이도 0이어야 합니다.

따라서 회귀 모델을 이 데이터에 적용할 때 원래 항이 0이 아닌 것은 의미가 없습니다.

다음 예에서는 일반적인 단순 선형 회귀 모델을 피팅하는 것과 원점을 통해 회귀를 구현하는 모델의 차이점을 보여줍니다.

예: 원점을 통한 회귀

생물학자가 나무 높이를 예측하기 위해 나무 둘레를 사용하여 회귀 모델을 맞추려고 한다고 가정해 보겠습니다. 그녀는 나가서 15그루의 나무 표본에 대해 다음 측정값을 수집합니다.

R에서 다음 코드를 사용하여 절편을 사용하지 않고 두 개의 회귀선을 그리는 회귀 모델로 간단한 선형 회귀 모델을 맞출 수 있습니다.

 #create data frame
df <- data. frame (circ=c(15, 19, 25, 39, 44, 46, 49, 54, 67, 79, 81, 84, 88, 90, 99),
                 height=c(200, 234, 285, 375, 440, 470, 564, 544, 639, 750, 830, 854,
                          901, 912, 989))

#fit a simple linear regression model
model <- lm(height ~ circ, data = df)

#fit regression through the origin
model_origin <- lm(height ~ 0 + ., data = df)

#create scatterplot
plot(df$circ, df$height, xlab=' Circumference ', ylab=' Height ',
     cex= 1.5 , pch= 16 , ylim=c(0.1000), xlim=c(0.100))

#add the fitted regression lines to the scatterplot
abline(model, col=' blue ', lwd= 2 )
abline(model_origin, lty=' dashed ', col=' red ', lwd= 2 )

원점에서 회귀

빨간색 점선은 원점을 통과하는 회귀 모델을 나타내고 파란색 실선은 일반적인 단순 선형 회귀 모델을 나타냅니다.

R에서 다음 코드를 사용하여 각 모델에 대한 계수 추정치를 얻을 수 있습니다.

 #display coefficients for simple linear regression model
coef(model)

(Intercept) circ 
  40.696971 9.529631 

#display coefficients for regression model through the origin
coef(model_origin)

    circ 
10.10574 

단순 선형 회귀 모델에 적합한 방정식은 다음과 같습니다.

높이 = 40.6969 + 9.5296(둘레)

그리고 원점을 통한 회귀 모델에 적합한 방정식은 다음과 같습니다.

높이 = 10.1057(원주)

원주 변수에 대한 계수 추정치는 약간 다릅니다.

원점을 통한 회귀 사용 시 주의사항

절편 회귀를 사용하기 전에 예측 변수의 값 0이 응답 변수의 값 0을 의미하는지 반드시 확인해야 합니다. 많은 시나리오에서 확실히 아는 것은 거의 불가능합니다.

그리고 원점을 추정할 때 자유도를 유지하기 위해 원점을 통한 회귀를 사용하는 경우 표본 크기가 충분히 크면 실질적인 차이가 거의 발생하지 않습니다.

원본을 통한 회귀를 사용하기로 선택한 경우 최종 분석이나 보고서에 추론을 간략히 설명하십시오.

추가 리소스

다음 자습서에서는 선형 회귀에 대한 추가 정보를 제공합니다.

단순 선형 회귀 소개
다중 선형 회귀 소개
회귀표를 읽고 해석하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다