R에서 잔차 플롯을 만드는 방법


잔차 도표는 회귀 분석의 잔차가 정규 분포를 따르는지 여부와 이분산성을 나타내는지 여부를 평가하는 데 자주 사용됩니다.

이 튜토리얼에서는 R에서 회귀 모델에 대한 잔차 플롯을 만드는 방법을 설명합니다.

예: R의 잔차 도표

이 예에서는 mtcars 내장 R 데이터 세트를 사용하여 회귀 모델을 맞춘 다음 세 가지 다른 잔차 플롯을 생성하여 잔차를 분석합니다.

1단계: 회귀 모델을 적합시킵니다.

먼저 mpg를 응답 변수로 사용하고 disphp를 설명 변수로 사용하여 회귀 모델을 피팅합니다.

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#get list of residuals 
res <- resid(model)

2단계: 잔차 또는 수정된 그림을 생성합니다.

다음으로, 이분산성을 시각적으로 감지하는 데 유용한 잔차/적합 플롯을 생성합니다. 예를 들어 값 범위에 대한 잔차 분포의 체계적인 변화가 있습니다.

 #produce residual vs. fitted plot
plot(fitted(model), res)

#add a horizontal line at 0 
abline(0,0)

R의 잔여 또는 조정된 지형

x축은 적합치를 표시하고 y축은 잔차를 표시합니다. 그래프에서 우리는 적합치가 높을수록 잔차 분포가 높아지는 경향이 있음을 알 수 있지만 이는 모델을 변경해야 할 만큼 심각해 보이지는 않습니다.

3단계: QQ 플롯을 생성합니다.

잔차가 정규 분포를 따르는지 여부를 결정하는 데 유용한 QQ 플롯을 생성할 수도 있습니다. 플롯의 데이터 값이 45도 각도로 대략 직선을 따르는 경우 데이터는 정규 분포를 따릅니다.

 #create QQ plot for residuals
qqnorm(res)

#add a straight diagonal line to the plot
qqline(res) 

R의 잔여 QQ 플롯

잔차가 꼬리 근처의 선에서 약간 벗어나는 경향이 있는 것을 볼 수 있는데, 이는 정규 분포가 아님을 나타낼 수 있습니다.

4단계: 밀도 플롯을 생성합니다.

또한 잔차가 정규 분포를 따르는지 여부를 시각적으로 확인하는 데 유용한 밀도 플롯을 생성할 수도 있습니다. 도표가 대략 종 모양인 경우 잔차는 정규 분포를 따를 가능성이 높습니다.

 #Create density plot of residuals
plot(density(res))

R의 잔류 밀도 곡선

밀도 플롯은 약간 오른쪽으로 기울어져 있지만 대략 종 모양을 따른다는 것을 알 수 있습니다. 연구 유형에 따라 연구자는 잔차가 보다 정규 분포를 갖도록 데이터 변환을 수행하기로 결정할 수도 있고 결정하지 않을 수도 있습니다.

추가 리소스

R에서 표준화 잔차를 계산하는 방법
R에서 스튜던트화 잔차를 계산하는 방법
R에서 잔차 히스토그램을 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다