Stata에서 계층적 회귀를 수행하는 방법


계층적 회귀는 여러 가지 선형 모델을 비교하는 데 사용할 수 있는 기술입니다.

기본 아이디어는 먼저 단일 설명 변수를 사용하여 선형 회귀 모델을 맞추는 것입니다. 다음으로 추가 설명 변수를 사용하여 또 다른 회귀 모델을 적합합니다. 두 번째 모델의 R-제곱(설명변수로 설명할 수 있는 반응변수의 분산 비율)이 이전 모델의 R-제곱보다 현저히 높다면 이는 두 번째 모델이 더 좋다는 의미입니다.

그런 다음 더 많은 설명 변수를 사용하여 추가 회귀 모델을 맞추는 과정을 반복하고 최신 모델이 이전 모델에 비해 개선점을 제공하는지 확인합니다.

이 튜토리얼은 Stata에서 계층적 회귀를 수행하는 방법에 대한 예를 제공합니다.

예: Stata의 계층적 회귀

Stata에서 계층적 회귀를 수행하는 방법을 설명하기 위해 auto 라는 내장 데이터 세트를 사용할 것입니다. 먼저 명령 상자에 다음을 입력하여 데이터세트를 로드합니다.

시스템 자동 사용

다음 명령을 사용하여 데이터에 대한 빠른 요약을 얻을 수 있습니다.

요약

Stata의 자동 데이터세트 요약

데이터 세트에는 총 74대의 자동차에 대한 12가지 변수에 대한 정보가 포함되어 있음을 알 수 있습니다.

다음 세 가지 선형 회귀 모델을 적합하고 계층적 회귀를 사용하여 각 후속 모델이 이전 모델에 비해 상당한 개선을 제공하는지 여부를 확인합니다.

모델 1: 가격 = 절편 + mpg

모델 2: 가격 = 절편 + mpg + 무게

모델 3: 가격 = 절편 + 연비 + 중량 + 기어비

Stata에서 계층적 회귀를 수행하려면 먼저 Hireg 패키지를 설치해야 합니다. 이렇게 하려면 명령 상자에 다음을 입력하십시오.

하이렉을 찾아라

나타나는 창에서 https://fmwww.bc.edu/RePEc/bocode/h에서 Hireg를 클릭하세요.

Stata에 Hireg 패키지 설치

다음 창에서 설치하려면 여기를 클릭하십시오 라는 링크를 클릭하십시오.

패키지는 몇 초 안에 설치됩니다. 그런 다음 계층적 회귀를 수행하기 위해 다음 명령을 사용합니다.

렌트 가격 (mpg) (중량) (기어_비)

Stata에게 요청하는 작업은 다음과 같습니다.

  • 가격을 각 모델의 반응 변수로 사용하여 계층적 회귀를 수행합니다.
  • 첫 번째 모델의 경우 mpg를 설명 변수로 사용합니다.
  • 두 번째 모델의 경우 추가 설명 변수로 가중치를 추가합니다.
  • 세 번째 모델의 경우 또 다른 설명 변수로 gear_ratio를 추가합니다.

첫 번째 모델의 결과는 다음과 같습니다.

Stata의 계층적 회귀 출력

모델의 R-제곱은 0.2196 이고 모델의 전체 p-값(Prob > F)은 0.0000 이며 이는 α = 0.05에서 통계적으로 유의합니다.

다음으로 두 번째 모델의 결과를 확인합니다.

Stata의 두 번째 모델의 계층적 회귀 출력

이 모델의 R 제곱은 0.2934 로 첫 번째 모델보다 큽니다. 이 차이가 통계적으로 유의한지 확인하기 위해 Stata는 결과 하단에 다음 숫자를 제공하는 F-테스트를 수행했습니다.

  • 두 모델 간의 R 제곱 차이 = 0.074
  • 차이에 대한 F 통계량 = 7.416
  • F 통계량의 해당 p-값 = 0.008

p-값이 0.05보다 작기 때문에 첫 번째 모델에 비해 두 번째 모델에서 통계적으로 유의미한 개선이 있었다는 결론을 내립니다.

마지막으로 세 번째 모델의 결과를 볼 수 있습니다.

Stata 해석의 계층적 회귀

이 모델의 R 제곱은 0.3150 으로 두 번째 모델보다 큽니다. 이 차이가 통계적으로 유의한지 확인하기 위해 Stata는 결과 하단에 다음 숫자를 제공하는 F-테스트를 수행했습니다.

  • 두 모델 간의 R 제곱 차이 = 0.022
  • 차이에 대한 F 통계량 = 2.206
  • F 통계량의 해당 p-값 = 0.142

p-값이 0.05 이상이므로 세 번째 모델이 두 번째 모델에 비해 개선을 제공한다고 말할 수 있는 충분한 증거가 없습니다.

결과의 마지막 부분에서 Stata가 결과 요약을 제공하는 것을 볼 수 있습니다.

Stata의 계층적 회귀 결과

이 특정 예에서는 모델 2가 모델 1에 비해 크게 개선되었지만 모델 3은 모델 2에 비해 크게 개선되지 않았다는 결론을 내릴 수 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다