로지스틱 회귀와 선형 회귀: 주요 차이점


가장 일반적으로 사용되는 회귀 모델 중 두 가지는 선형 회귀로지스틱 회귀 입니다.

두 가지 유형의 회귀 모델 모두 하나 이상의 예측 변수와 반응 변수 간의 관계를 정량화하는 데 사용되지만 두 모델 간에는 몇 가지 주요 차이점이 있습니다.

로지스틱 회귀와 선형 회귀

차이점을 요약하면 다음과 같습니다.

차이점 #1: 응답 변수 유형

선형 회귀 모델은 반응 변수가 다음과 같은 연속 값을 가질 때 사용됩니다.

  • 가격
  • 나이
  • 거리

반대로, 로지스틱 회귀 모델은 반응 변수가 다음과 같은 범주형 값을 가질 때 사용됩니다.

  • 예 혹은 아니오
  • 남성 또는 여성
  • 이기든 말든

차이점 #2: 사용된 방정식

선형 회귀는 다음 방정식을 사용하여 예측 변수와 반응 변수 간의 관계를 요약합니다.

Y = β 0 + β 1 X 1 + β 2 X 2 + … + β p

금:

  • Y: 반응 변수
  • X j : j 번째 예측변수
  • β j : 다른 모든 예측 변수를 고정한 상태에서 X j 의 1단위 증가가 Y에 미치는 평균 효과

반대로 로지스틱 회귀에서는 다음 방정식을 사용합니다.

p(X) = e β 0 + β 1 X 1 + β 2 X 2 + + β p

이 방정식은 개별 관찰이 특정 범주에 속할 확률을 예측하는 데 사용됩니다.

차이점 #3: 방정식을 맞추는 데 사용되는 방법

선형 회귀는 보통 최소 제곱 법으로 알려진 방법을 사용하여 가장 적합한 회귀 방정식을 찾습니다.

반대로, 로지스틱 회귀는 가장 적합한 회귀 방정식을 찾기 위해 최대 우도 추정 이라는 방법을 사용합니다.

차이점 #4: 예측할 출력

선형 회귀는 연속 값을 출력으로 예측합니다. 예를 들어:

  • 가격($150, $199, $400 등)
  • 높이(14인치, 2피트, 94.32센티미터 등)
  • 연령(2개월, 6세, 41.5세 등)
  • 거리(1.23마일, 4.5킬로미터 등)

반대로 로지스틱 회귀는 확률을 결과로 예측합니다. 예를 들어:

  • 대학에 합격할 확률은 40.3%입니다.
  • 게임에서 승리할 확률은 93.2%입니다.
  • 법이 채택될 확률은 34.2%이다.

로지스틱 회귀 또는 선형 회귀를 사용하는 경우

다음 연습 문제는 로지스틱 회귀 또는 선형 회귀를 언제 사용해야 하는지 더 잘 이해하는 데 도움이 될 수 있습니다.

문제 #1: 연소득

경제학자가 예측 변수 (1) 주당 근무 시간과 (2) 교육 기간을 사용하여 개인의 연간 소득을 예측한다고 가정해 보겠습니다.

이 시나리오에서는 응답 변수(연간 소득)가 연속형이므로 선형 회귀 분석을 사용합니다.

문제 #2: 대학 입학

대학 입학 담당자가 예측 변수 (1) GPA 및 (2) ACT 점수를 사용하여 학생이 특정 대학에 합격할 가능성을 예측하려고 한다고 가정해 보겠습니다.

이 시나리오에서는 응답 변수가 범주형이고 허용 여부라는 두 가지 값만 사용할 수 있으므로 로지스틱 회귀 분석을 사용합니다.

문제 #3: 부동산 가격

부동산 중개인이 예측 변수 (1) 평방피트, (2) 침실 수, (3) 욕실 수를 사용하여 주택 판매 가격을 예측하려고 한다고 가정해 보겠습니다.

이 시나리오에서는 응답 변수(가격)가 연속형이므로 선형 회귀를 사용합니다.

문제 #4: 스팸 감지

컴퓨터 프로그래머가 예측 변수 (1) 단어 수와 (2) 출신 국가를 사용하여 특정 이메일이 스팸일 확률을 예측한다고 가정해 보겠습니다.

이 시나리오에서는 응답 변수가 범주형이고 스팸 또는 스팸 아님이라는 두 가지 값만 사용할 수 있으므로 로지스틱 회귀를 사용합니다.

추가 리소스

다음 자습서에서는 선형 회귀에 대한 자세한 내용을 제공합니다.

다음 자습서에서는 로지스틱 회귀에 대한 자세한 내용을 제공합니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다