곡선 회귀란 무엇입니까? (정의 및 예)


곡선 회귀는 직선이 아닌 곡선을 맞추려는 회귀 모델에 부여된 이름입니다.

곡선 회귀 모델의 일반적인 예는 다음과 같습니다.

2차 회귀: 예측 변수와 반응 변수 사이에 2차 관계가 존재할 때 사용됩니다. 그래프로 표시할 때 이러한 유형의 관계는 산점도에서 “U” 또는 반전된 “U”처럼 보입니다.

3차 회귀: 예측 변수와 반응 변수 사이에 3차 관계가 존재할 때 사용됩니다. 그래프로 표시할 때 이 유형의 관계는 산점도에 두 개의 서로 다른 곡선을 표시합니다.

이 두 가지 모두 예측 변수와 응답 변수 간의 관계가 선형인 단순 선형 회귀와 대조됩니다.

곡선 회귀 모델의 공식

단순 선형 회귀 모델은 다음 공식을 사용하여 데이터 세트를 맞추려고 시도합니다.

ŷ = β 0 + β 1 x

금:

  • ŷ: 반응변수
  • β 0 , β 1 : 회귀계수
  • x: 예측 변수

이와 대조적으로 2차 회귀 모델은 다음 공식을 사용합니다.

ŷ = β 0 + β 1 x + β 2 x 2

3차 회귀 모델은 다음 공식을 사용합니다.

ŷ = β 0 + β 1 x + β 2 x 2 + β 3 x 3

지수를 포함하는 회귀 모델에 부여되는 보다 일반적인 이름은 다음 공식을 사용하는 다항식 회귀 입니다.

ŷ = β 0 + β 1 x + β 2 x 2 + … + β k x k

k 값은 다항식의 차수를 나타냅니다. 차수는 임의의 양수일 수 있지만 실제로는 3 또는 4보다 큰 차수를 갖는 다항식 회귀 모델을 거의 적합하지 않습니다.

회귀 모델 공식에 지수를 사용함으로써 다항식 회귀 모델은 직선 대신 곡선을 데이터 세트에 맞출 수 있습니다.

곡선 회귀를 사용해야 하는 경우

곡선 회귀를 사용해야 하는지 여부를 알 수 있는 가장 쉬운 방법은 예측 변수와 반응 변수의 산점도를 만드는 것입니다.

산점도가 두 변수 사이의 선형 관계를 표시하는 경우 단순 선형 회귀가 적절할 것입니다.

그러나 산점도가 예측 변수와 반응 변수 사이에 2차, 3차 또는 기타 곡선 패턴을 표시하는 경우 곡선 회귀 분석을 사용하는 것이 더 적절할 수 있습니다.

또한 단순 선형 회귀 모델과 곡선 회귀 모델을 피팅하고 각 모델의 피팅된 R-제곱 값을 비교하여 어떤 모델이 데이터에 가장 적합한 피팅을 제공하는지 결정할 수 있습니다.

수정된 R-제곱은 모형의 예측 변수 수에 맞게 조정된 예측 변수에 의해 설명될 수 있는 반응 변수의 분산 정도를 알려주기 때문에 유용합니다.

일반적으로 수정된 R-제곱 값이 가장 높은 모델이 데이터 세트에 더 잘 맞습니다.

추가 리소스

다음 튜토리얼에서는 다양한 통계 소프트웨어에서 다항식 회귀를 수행하는 방법을 설명합니다.

다항식 회귀 소개
Excel에서 다항식 회귀를 수행하는 방법
Python에서 다항식 회귀를 수행하는 방법
R에서 다항식 회귀를 수행하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다