Stata에서 다중 선형 회귀를 수행하는 방법


다중 선형 회귀는 여러 설명 변수와 반응 변수 간의 관계를 이해하는 데 사용할 수 있는 방법입니다.

이 튜토리얼에서는 Stata에서 다중 선형 회귀를 수행하는 방법을 설명합니다.

예: Stata의 다중 선형 회귀

갤런당 마일리지와 무게가 자동차 가격에 영향을 미치는지 알고 싶다고 가정해 보겠습니다. 이를 테스트하기 위해 갤런당 마일과 무게를 두 설명 변수로 사용하고 가격을 응답 변수로 사용하여 다중 선형 회귀를 수행할 수 있습니다.

74개의 서로 다른 자동차에 대한 데이터가 포함된 auto 라는 데이터세트를 사용하여 다중 선형 회귀를 수행하려면 Stata에서 다음 단계를 완료하세요.

1단계: 데이터를 로드합니다.

명령 상자에 다음을 입력하여 데이터를 로드합니다.

https://www.stata-press.com/data/r13/auto를 사용하세요.

2단계: 데이터 요약을 가져옵니다.

명령 상자에 다음을 입력하여 작업 중인 데이터를 빠르게 이해하세요.

요약

Stata의 데이터 요약

데이터 세트에 12개의 서로 다른 변수가 있음을 알 수 있지만 우리가 관심 있는 변수는 mpg , WeightPrice 뿐입니다.

이 세 가지 변수에 대한 다음과 같은 기본 요약 통계를 볼 수 있습니다.

가격 | 평균 = $6,165, 최소 = $3,291, 최대 $15,906

mpg | 평균 = 21.29, 최소 = 12, 최대 = 41

무게 | 평균 = 3,019파운드, 최소 = 1,760파운드, 최대 = 4,840파운드

3단계: 다중 선형 회귀를 수행합니다.

설명 변수로 mpg와 Weight를 사용하고 응답 변수로 가격을 사용하여 다중 선형 회귀를 수행하려면 명령 상자에 다음을 입력합니다.

회귀 가격 mpg 무게

Stata의 다중 회귀 출력

결과에서 가장 흥미로운 숫자를 해석하는 방법은 다음과 같습니다.

확률 > F: 0.000. 이는 전체 회귀에 대한 p-값입니다. 이 값은 0.05보다 작으므로 mpg체중 의 결합된 설명변수가 반응변수인 가격 과 통계적으로 유의한 관계가 있음을 나타냅니다.

R 제곱: 0.2934. 이는 설명 변수로 설명할 수 있는 반응 변수의 분산 비율입니다. 이 예에서는 가격 변동의 29.34%가 mpg와 중량으로 설명될 수 있습니다.

계수(mpg): -49.512. 이는 무게가 일정하다고 가정할 때 mpg의 1단위 증가와 관련된 가격의 평균 변화를 알려줍니다. 이 예에서, 무게가 일정하다고 가정할 때 mpg가 1단위 증가할 때마다 가격은 평균 약 $49.51 감소합니다.

예를 들어 자동차 A와 B의 무게가 모두 2,000파운드라고 가정합니다. 자동차 A의 연비가 20mpg이고 자동차 B의 연비가 19mpg인 경우 자동차 A의 가격은 자동차 B의 가격보다 $49.51 저렴할 것으로 예상할 수 있습니다.

피>|티| (mpg): 0.567. 이는 mpg에 대한 검정 통계량과 관련된 p-값입니다. 이 값은 0.05 이상이므로 mpg가 가격과 통계적으로 유의미한 관계가 있다는 증거는 없습니다.

계수(무게): 1,746. 이는 mpg가 일정하다고 가정할 때 무게가 한 단위 증가할 때 발생하는 가격의 평균 변화를 알려줍니다. 이 예에서, mpg가 일정하다고 가정할 때 무게가 1단위 증가할 때마다 가격은 평균 약 1.74달러 증가합니다.

예를 들어, 자동차 A와 B가 모두 20mpg를 얻는다고 가정해 보겠습니다. 자동차 A의 무게가 자동차 B보다 1파운드 더 무겁다면 자동차 A의 가격은 $1.74 더 높아야 합니다.

피>|티| (중량): 0.008. 이는 체중에 대한 검정 통계량과 연관된 p-값입니다. 이 값은 0.05보다 작기 때문에 무게가 가격과 통계적으로 유의미한 관계가 있다고 말할 수 있는 충분한 증거가 있습니다.

계수(_cons): 1946.069. 이는 mpg와 중량이 0일 때 자동차의 평균 가격을 알려줍니다. 이 예에서 무게와 mpg가 0일 때 평균 가격은 $1,946입니다. 자동차의 무게와 mpg는 0이 될 수 없기 때문에 이는 실제로 해석하는 데 의미가 없지만 회귀 방정식을 형성하려면 숫자 1946.069가 필요합니다.

4단계: 결과를 보고합니다.

마지막으로 다중 선형 회귀의 결과를 보고하려고 합니다. 이를 수행하는 방법의 예는 다음과 같습니다.

자동차의 중량과 mpg, 가격 간의 관계를 정량화하기 위해 다중 선형 회귀가 수행되었습니다. 분석에는 74대의 자동차 샘플이 사용되었습니다.

그 결과, 무게와 가격(t=2.72, p=0.008)은 통계적으로 유의한 관계가 있었으나, mpg와 가격(그리고 mpg(t=-0.57, p=0.567))은 통계적으로 유의한 관계가 없는 것으로 나타났다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다