원점을 통한 회귀: 정의 및 예

에 의해 벤자민 앤더슨 7월 21, 2023 가이드 댓글 0개

단순 선형 회귀는 하나 이상의 예측 변수와 반응 변수 간의 관계를 수량화하는 데 사용할 수 있는 방법입니다.

단순 선형 회귀 모델은 다음과 같은 형식을 취합니다.

y = β ₀ + β ₁ x

금:

y : 응답 변수의 값
β ₀ : x = 0일 때 반응 변수의 값(“절편” 항이라고 함)
β ₁ : x의 1단위 증가와 관련된 반응 변수의 평균 증가
x : 예측변수의 값

이 모델의 수정된 버전은 원점을 통한 회귀 로 알려져 있으며, x가 0일 때 y를 0과 동일하게 만듭니다.

이 유형의 모델은 다음과 같은 형식을 취합니다.

y = _β1x

절편 항이 모델에서 완전히 제거되었습니다.

이 모델은 예측 변수가 0일 때 반응 변수도 0이어야 한다는 것을 연구자가 알고 있을 때 때때로 사용됩니다.

현실 세계에서는 이러한 유형의 모델이 임업이나 생태학 연구 에서 가장 자주 사용됩니다.

예를 들어, 연구자들은 나무 둘레를 사용하여 나무 높이를 예측할 수 있습니다. 주어진 나무의 원주가 0이면 높이도 0이어야 합니다.

따라서 회귀 모델을 이 데이터에 적용할 때 원래 항이 0이 아닌 것은 의미가 없습니다.

다음 예에서는 일반적인 단순 선형 회귀 모델을 피팅하는 것과 원점을 통해 회귀를 구현하는 모델의 차이점을 보여줍니다.

예: 원점을 통한 회귀

생물학자가 나무 높이를 예측하기 위해 나무 둘레를 사용하여 회귀 모델을 맞추려고 한다고 가정해 보겠습니다. 그녀는 나가서 15그루의 나무 표본에 대해 다음 측정값을 수집합니다.

R에서 다음 코드를 사용하여 절편을 사용하지 않고 두 개의 회귀선을 그리는 회귀 모델로 간단한 선형 회귀 모델을 맞출 수 있습니다.

 #create data frame
df <- data. frame (circ=c(15, 19, 25, 39, 44, 46, 49, 54, 67, 79, 81, 84, 88, 90, 99),
                 height=c(200, 234, 285, 375, 440, 470, 564, 544, 639, 750, 830, 854,
                          901, 912, 989))

#fit a simple linear regression model
model <- lm(height ~ circ, data = df)

#fit regression through the origin
model_origin <- lm(height ~ 0 + ., data = df)

#create scatterplot
plot(df$circ, df$height, xlab=' Circumference ', ylab=' Height ',
     cex= 1.5 , pch= 16 , ylim=c(0.1000), xlim=c(0.100))

#add the fitted regression lines to the scatterplot
abline(model, col=' blue ', lwd= 2 )
abline(model_origin, lty=' dashed ', col=' red ', lwd= 2 )

원점에서 회귀

빨간색 점선은 원점을 통과하는 회귀 모델을 나타내고 파란색 실선은 일반적인 단순 선형 회귀 모델을 나타냅니다.

R에서 다음 코드를 사용하여 각 모델에 대한 계수 추정치를 얻을 수 있습니다.

 #display coefficients for simple linear regression model
coef(model)

(Intercept) circ 
  40.696971 9.529631 

#display coefficients for regression model through the origin
coef(model_origin)

    circ 
10.10574

단순 선형 회귀 모델에 적합한 방정식은 다음과 같습니다.

높이 = 40.6969 + 9.5296(둘레)

그리고 원점을 통한 회귀 모델에 적합한 방정식은 다음과 같습니다.

높이 = 10.1057(원주)

원주 변수에 대한 계수 추정치는 약간 다릅니다.

원점을 통한 회귀 사용 시 주의사항

절편 회귀를 사용하기 전에 예측 변수의 값 0이 응답 변수의 값 0을 의미하는지 반드시 확인해야 합니다. 많은 시나리오에서 확실히 아는 것은 거의 불가능합니다.

그리고 원점을 추정할 때 자유도를 유지하기 위해 원점을 통한 회귀를 사용하는 경우 표본 크기가 충분히 크면 실질적인 차이가 거의 발생하지 않습니다.

원본을 통한 회귀를 사용하기로 선택한 경우 최종 분석이나 보고서에 추론을 간략히 설명하십시오.

추가 리소스

다음 자습서에서는 선형 회귀에 대한 추가 정보를 제공합니다.

단순 선형 회귀 소개
다중 선형 회귀 소개
회귀표를 읽고 해석하는 방법

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기

예: 원점을 통한 회귀

원점을 통한 회귀 사용 시 주의사항

추가 리소스

저자 소개

벤자민 앤더슨

의견을 추가하다