R에서 부분 잔차 플롯을 만드는 방법


다중 선형 회귀는 다중 예측 변수와 반응 변수 사이의 관계를 이해하는 데 사용할 수 있는 통계 방법입니다.

그러나 다중 선형 회귀 분석의 주요 가정 중 하나는 각 예측 변수와 반응 변수 사이에 선형 관계가 있다는 것입니다.

이 가정이 충족되지 않으면 회귀 모델의 결과를 신뢰할 수 없을 수 있습니다.

이 가정을 테스트하는 한 가지 방법은 반응 변수에 상대적인 예측 변수의 잔차를 표시하는 부분 잔차 그림을 만드는 것입니다.

다음 예에서는 R에서 회귀 모델에 대한 부분 잔차 그림을 만드는 방법을 보여줍니다.

예: R에서 부분 잔차 도표를 만드는 방법

R에서 세 가지 예측 변수를 사용하여 회귀 모델을 적합하다고 가정합니다.

 #make this example reproducible
set. seeds (0)

#define response variable
y <- c(1:1000)

#define three predictor variables
x1 <- c(1:1000)*runif(n=1000)
x2 <- (c(1:1000)*rnorm(n=1000))^2
x3 <- (c(1:1000)*rnorm(n=1000))^3

#fit multiple linear regression model
model <- lm(y~x1+x2+x3))

R의 car 패키지에 있는 crPlots() 함수를 사용하여 모델의 각 예측 변수에 대한 부분 잔차 플롯을 만들 수 있습니다.

 library (car)

#create partial residual plots
crPlots(model)

R의 부분 잔차 플롯

파란색 선은 예측 변수와 반응 변수 간의 관계가 선형인 경우 예상 잔차를 표시합니다. 분홍색 선은 실제 잔차를 나타냅니다.

두 선이 크게 다른 경우 이는 비선형 관계를 나타냅니다.

위의 그래프에서 x2와 x3의 잔차가 비선형으로 나타나는 것을 볼 수 있습니다.

이는 다중 선형 회귀의 선형성 가정을 위반합니다. 이 문제를 해결하는 한 가지 방법은 예측 변수에 대해 제곱근 또는 3차근 변환을 사용하는 것입니다.

 library (car)

#fit new model with transformed predictor variables
model_transformed <- lm(y~x1+sqrt(x2)+log10(x3^(1/3)))

#create partial residual plots for new model
crPlots(model_transformed)

부분 잔차 그림에서 이제 x2가 반응 변수와 더 선형적인 관계를 갖고 있음을 알 수 있습니다.

x3 예측 변수는 여전히 다소 비선형적이므로 다른 변환을 시도하거나 모델에서 변수를 완전히 제거하기로 결정할 수 있습니다.

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 플롯을 만드는 방법을 설명합니다.

R에서 진단 플롯을 만드는 방법
R에서 축척 및 위치 플롯을 만드는 방법
R에서 잔차 플롯을 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다