곡선 회귀란 무엇입니까? (정의 및 예)
곡선 회귀는 직선이 아닌 곡선을 맞추려는 회귀 모델에 부여된 이름입니다.
곡선 회귀 모델의 일반적인 예는 다음과 같습니다.
2차 회귀: 예측 변수와 반응 변수 사이에 2차 관계가 존재할 때 사용됩니다. 그래프로 표시할 때 이러한 유형의 관계는 산점도에서 “U” 또는 반전된 “U”처럼 보입니다.
3차 회귀: 예측 변수와 반응 변수 사이에 3차 관계가 존재할 때 사용됩니다. 그래프로 표시할 때 이 유형의 관계는 산점도에 두 개의 서로 다른 곡선을 표시합니다.
이 두 가지 모두 예측 변수와 응답 변수 간의 관계가 선형인 단순 선형 회귀와 대조됩니다.
곡선 회귀 모델의 공식
단순 선형 회귀 모델은 다음 공식을 사용하여 데이터 세트를 맞추려고 시도합니다.
ŷ = β 0 + β 1 x
금:
- ŷ: 반응변수
- β 0 , β 1 : 회귀계수
- x: 예측 변수
이와 대조적으로 2차 회귀 모델은 다음 공식을 사용합니다.
ŷ = β 0 + β 1 x + β 2 x 2
3차 회귀 모델은 다음 공식을 사용합니다.
ŷ = β 0 + β 1 x + β 2 x 2 + β 3 x 3
지수를 포함하는 회귀 모델에 부여되는 보다 일반적인 이름은 다음 공식을 사용하는 다항식 회귀 입니다.
ŷ = β 0 + β 1 x + β 2 x 2 + … + β k x k
k 값은 다항식의 차수를 나타냅니다. 차수는 임의의 양수일 수 있지만 실제로는 3 또는 4보다 큰 차수를 갖는 다항식 회귀 모델을 거의 적합하지 않습니다.
회귀 모델 공식에 지수를 사용함으로써 다항식 회귀 모델은 직선 대신 곡선을 데이터 세트에 맞출 수 있습니다.
곡선 회귀를 사용해야 하는 경우
곡선 회귀를 사용해야 하는지 여부를 알 수 있는 가장 쉬운 방법은 예측 변수와 반응 변수의 산점도를 만드는 것입니다.
산점도가 두 변수 사이의 선형 관계를 표시하는 경우 단순 선형 회귀가 적절할 것입니다.
그러나 산점도가 예측 변수와 반응 변수 사이에 2차, 3차 또는 기타 곡선 패턴을 표시하는 경우 곡선 회귀 분석을 사용하는 것이 더 적절할 수 있습니다.
또한 단순 선형 회귀 모델과 곡선 회귀 모델을 피팅하고 각 모델의 피팅된 R-제곱 값을 비교하여 어떤 모델이 데이터에 가장 적합한 피팅을 제공하는지 결정할 수 있습니다.
수정된 R-제곱은 모형의 예측 변수 수에 맞게 조정된 예측 변수에 의해 설명될 수 있는 반응 변수의 분산 정도를 알려주기 때문에 유용합니다.
일반적으로 수정된 R-제곱 값이 가장 높은 모델이 데이터 세트에 더 잘 맞습니다.
추가 리소스
다음 튜토리얼에서는 다양한 통계 소프트웨어에서 다항식 회귀를 수행하는 방법을 설명합니다.
다항식 회귀 소개
Excel에서 다항식 회귀를 수행하는 방법
Python에서 다항식 회귀를 수행하는 방법
R에서 다항식 회귀를 수행하는 방법