Anova와 회귀: 차이점은 무엇입니까?


통계에서 일반적으로 사용되는 두 가지 모델은 ANOVA와 회귀 모델입니다.

이 두 가지 유형의 모델은 다음과 같은 유사점을 공유합니다.

  • 각 모델의 반응 변수는 연속형입니다. 연속형 변수의 예로는 체중, 키, 길이, 너비, 시간, 연령 등이 있습니다.

그러나 이 두 가지 유형의 모델에는 다음과 같은 차이점이 있습니다.

  • ANOVA 모델은 예측 변수가 범주형일 때 사용됩니다. 범주형 변수의 예로는 교육 수준, 눈 색깔, 결혼 여부 등이 있습니다.
  • 회귀 모델은 예측 변수가 연속형일 때 사용됩니다.*

*회귀 모델은 범주형 예측 변수와 함께 사용할 수 있지만 이를 사용하려면 더미 변수를 만들어야 합니다.

다음 예는 실제로 언제 ANOVA 또는 회귀 모델을 사용해야 하는지 보여줍니다.

예 1: 선호하는 분산 분석 모델

생물학자가 네 가지 다른 비료가 한 달 동안 동일한 평균 식물 성장(인치 단위)을 가져오는지 여부를 이해하려고 한다고 가정해 보겠습니다. 이를 테스트하기 위해 그녀는 각 비료를 20개의 식물에 적용하고 한 달 후에 각 식물의 성장을 기록합니다.

이 시나리오에서는 예측 변수가 있고 범주형이므로 생물학자는 일원 분산 분석 모델을 사용하여 비료 간의 차이를 분석해야 합니다.

즉, 예측변수의 값은 다음과 같은 “범주”로 분류될 수 있습니다.

  • 비료 1
  • 비료 2
  • 비료 3
  • 비료 4

일원 분산 분석은 생물학자에게 네 가지 비료 간에 평균 식물 성장이 동일한지 여부를 알려줍니다.

예 2: 선호하는 회귀 모델

부동산 중개인이 면적과 부동산 가격 사이의 관계를 이해하려고 한다고 가정해 보겠습니다. 이 관계를 분석하기 위해 그는 특정 도시에 있는 주택 200채의 면적과 가격에 대한 데이터를 수집합니다.

이 시나리오에서 부동산 중개인은 예측 변수(제곱피트)가 연속적이므로 단순 선형 회귀 모델을 사용하여 이 두 변수 간의 관계를 분석해야 합니다.

단순 선형 회귀를 사용하여 부동산 중개인은 다음 회귀 모델을 적합할 수 있습니다.

부동산 가격 = β 0 + β 1 (제곱 면적)

β 1 값은 각 추가 평방 피트와 관련된 주택 가격의 평균 변화를 나타냅니다.

이를 통해 부동산 중개인은 면적과 부동산 가격 간의 관계를 수량화할 수 있습니다.

예 3: 선호 더미 변수를 사용한 회귀 모델

부동산 중개인이 예측 변수 “평방 피트수”와 “주택 유형”(단독 주택, 아파트, 연립 주택)과 부동산 가격의 반응 변수 사이의 관계를 이해하려고 한다고 가정합니다.

이 시나리오에서 부동산 중개인은 “집 유형”이 현재 범주형 변수이므로 더미 변수로 변환하여 다중 선형 회귀를 사용할 수 있습니다.

그러면 부동산 중개인은 다음과 같은 다중 선형 회귀 모델을 적합할 수 있습니다.

부동산가격 = β0 + β1 (평방면적) + β2 (단독주택) + β3 (아파트)

모델 계수를 해석하는 방법은 다음과 같습니다.

  • β 1 : 1 제곱피트 추가에 따른 주택 가격의 평균 변화입니다.
  • β 2 : 면적이 일정하다고 가정할 때 단독 주택과 연립 주택의 평균 가격 차이입니다.
  • β 3 : 연면적이 일정하다고 가정한 단독주택과 아파트의 평균 가격 차이.

다양한 통계 소프트웨어에서 더미 변수를 생성하는 방법을 보려면 다음 튜토리얼을 확인하십시오.

추가 리소스

다음 자습서에서는 분산 분석 모델에 대한 심층적인 소개를 제공합니다.

다음 자습서에서는 선형 회귀 모델에 대한 심층적인 소개를 제공합니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다