로그 회귀

이 기사에서는 로그 회귀가 무엇인지, 그리고 어떻게 수행되는지 설명합니다. 또한 개념을 완전히 이해하기 위해 로그 회귀의 예를 볼 수 있습니다.

로그 회귀란 무엇입니까?

로그 회귀는 방정식에 로그를 포함하는 회귀 모델입니다. 구체적으로, 로그 회귀에서는 독립 변수의 로그가 사용됩니다. 따라서 로그 회귀 모델의 방정식은 y=a+b·ln(x)입니다.

로그 회귀는 표본 데이터가 로그 곡선을 형성할 때 회귀 모델을 피팅하여 회귀 모델이 표본 데이터에 더 잘 맞도록 하는 데 매우 유용합니다. 아래에서는 언제 로그 회귀를 수행해야 하는지 살펴보겠습니다.

따라서 로그 회귀는 지수 회귀 및 다항 회귀와 마찬가지로 일종의 비선형 회귀입니다.

대수 회귀 공식

로그 회귀 모델에는 독립 변수의 로그를 취하는 것이 포함됩니다. 따라서 로그 회귀 방정식의 공식은 y=a+b·ln(x)입니다.

y=a+b\cdot \ln(x)

금:

  • y

    종속변수입니다.

  • x

    독립변수이다.

  • a,b

    회귀 계수입니다.

y=a+b·ln(x)는 실제로 선의 방정식이지만 원래 변수 x와 y를 참조하는 대신 변수 ln(x)와 y를 참조합니다.

로그 회귀 분석은 언제 수행합니까?

표본 데이터의 그래프가 로그 곡선일 때, 즉 점들의 플롯이 로그 함수의 그래프와 유사할 때 로그 회귀를 수행해야 합니다.

아래 산점도를 보면 선형 회귀 모델이 데이터 세트에 맞춰졌습니다. 보시다시피 선은 데이터에 대한 나쁜 근사치가 아니지만, 조심하면 그래프 끝 부분보다 시작 부분에서 값이 더 빠르게 증가하므로 선이 관측값과 완전히 일치하지 않습니다. .

따라서 데이터가 로그 곡선을 따르는 것처럼 보이기 때문에 로그 회귀 모델을 만드는 것이 좋습니다. 로그 회귀 모델에서 얻은 결과는 다음과 같습니다.

로그 회귀 예제

이전 그래프에서 볼 수 있듯이 결과 로그 회귀 모델은 샘플 데이터에 더 잘 맞습니다. 실제로 결정 계수가 66.87%에서 80.05%로 증가하여 이제 모델이 데이터 샘플을 더 잘 설명할 수 있습니다. 따라서 이 경우에는 로지스틱 회귀를 사용하여 데이터 값에 근접한 방정식을 찾는 것이 좋습니다.

다른 유형의 비선형 회귀

비선형 회귀의 가장 일반적인 세 가지 사례는 다음과 같습니다.

  • 로그 회귀 : 독립 변수의 로그가 사용됩니다.
  • 지수 회귀 : 독립 변수는 방정식의 지수입니다.
  • 다항식 회귀(Polynomial Regression) : 회귀 모델 방정식은 다항식 형태입니다.
참고: 지수 회귀
참고: 다항식 회귀

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다