규모 및 위치 도표를 해석하는 방법: 예 포함


축척 위치 차트는 x축을 따라 회귀 모델 의 적합값을 표시하고 y축을 따라 표준화 잔차의 제곱근을 표시하는 차트 유형입니다.

축척된 위치 차트

이 그래프를 보면 다음 두 가지를 확인할 수 있습니다.

1. 빨간색 선이 플롯에서 대략 수평인지 확인합니다. 이 경우, 주어진 회귀 모델에 대해 등분산성 가정이 충족될 가능성이 높습니다. 즉, 잔차 분포는 모든 적합치에 대해 대략 동일합니다.

2. 잔차 사이에 뚜렷한 추세가 없는지 확인합니다. 즉, 잔차는 모든 적합치에 대해 거의 동일한 변동성을 갖고 빨간색 선 주위에 무작위로 분산되어야 합니다.

R의 규모 및 위치 플로팅

다음 코드를 사용하여 R에 간단한 선형 회귀 모델을 맞추고 결과 모델에 대한 규모 및 위치 플롯을 생성할 수 있습니다.

 #fit simple linear regression model
model <- lm(Ozone ~ Temp, data = airquality)

#produce scale-location plot
plot(model)

R의 스케일 위치 플롯

이 회귀모델의 척도-위치 플롯에서 다음 두 가지를 관찰할 수 있습니다.

1. 빨간색 선은 플롯에서 대략 수평입니다. 이 경우, 주어진 회귀 모델에 대해 등분산성 가정이 충족됩니다. 즉, 잔차 분포는 모든 적합치에 대해 대략 동일합니다.

2. 잔차 사이에 뚜렷한 추세가 없는지 확인합니다. 즉, 잔차는 모든 적합치에 대해 거의 동일한 변동성을 갖고 빨간색 선 주위에 무작위로 분산되어야 합니다.

기술 노트

표준화된 잔차가 가장 높은 데이터 세트의 세 가지 관측치가 그래프에 표시됩니다.

30, 62, 117행의 관측치가 가장 높은 표준화 잔차를 가지고 있음을 알 수 있습니다.

이것이 반드시 이러한 관측치가 특이치라는 것을 의미하는 것은 아니지만 이러한 관측치를 더 자세히 조사하기 위해 원래 데이터를 살펴보는 것이 좋습니다.

척도 위치 플롯에서 빨간색 선이 대략 수평임을 알 수 있지만 이는 등분산성 가정이 충족되는지 확인하는 시각적인 방법일 뿐입니다.

등분산성 가정이 충족되는지 확인하는 데 사용할 수 있는 공식적인 통계 테스트는 Breusch-Pagan 테스트 입니다.

R의 Breusch-Pagan 테스트

다음 코드는 lmtest 패키지의 bpttest() 함수를 사용하여 R에서 Breusch-Pagan 테스트를 수행하는 방법을 보여줍니다.

 #load lmtest package
library(lmtest)

#perform Breusch-Pagan Test
bptest(model)

	studentized Breusch-Pagan test

data: model
BP = 1.4798, df = 1, p-value = 0.2238

Breusch-Pagan 테스트는 다음과 같은 귀무 가설과 대립 가설을 사용합니다.

  • 귀무 가설(H 0 ): 잔차는 등분산적입니다(즉, 균일하게 분포됨).
  • 대립 가설( HA ): 잔차는 이분산적입니다(즉, 균일하게 분포되지 않음).

결과에서 테스트의 p-값이 0.2238 임을 알 수 있습니다. 이 p-값은 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 회귀 모델에 이분산성이 존재한다고 주장할 수 있는 충분한 증거가 없습니다.

이 결과는 스케일-위치 플롯의 빨간색 선을 육안으로 검사한 것과 일치합니다.

추가 리소스

회귀 분석의 이분산성 이해
R에서 잔차 플롯을 만드는 방법
R에서 Breusch-Pagan 테스트를 수행하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다