R에서 부분 잔차 플롯을 만드는 방법
다중 선형 회귀는 다중 예측 변수와 반응 변수 사이의 관계를 이해하는 데 사용할 수 있는 통계 방법입니다.
그러나 다중 선형 회귀 분석의 주요 가정 중 하나는 각 예측 변수와 반응 변수 사이에 선형 관계가 있다는 것입니다.
이 가정이 충족되지 않으면 회귀 모델의 결과를 신뢰할 수 없을 수 있습니다.
이 가정을 테스트하는 한 가지 방법은 반응 변수에 상대적인 예측 변수의 잔차를 표시하는 부분 잔차 그림을 만드는 것입니다.
다음 예에서는 R에서 회귀 모델에 대한 부분 잔차 그림을 만드는 방법을 보여줍니다.
예: R에서 부분 잔차 도표를 만드는 방법
R에서 세 가지 예측 변수를 사용하여 회귀 모델을 적합하다고 가정합니다.
#make this example reproducible set. seeds (0) #define response variable y <- c(1:1000) #define three predictor variables x1 <- c(1:1000)*runif(n=1000) x2 <- (c(1:1000)*rnorm(n=1000))^2 x3 <- (c(1:1000)*rnorm(n=1000))^3 #fit multiple linear regression model model <- lm(y~x1+x2+x3))
R의 car 패키지에 있는 crPlots() 함수를 사용하여 모델의 각 예측 변수에 대한 부분 잔차 플롯을 만들 수 있습니다.
library (car) #create partial residual plots crPlots(model)
파란색 선은 예측 변수와 반응 변수 간의 관계가 선형인 경우 예상 잔차를 표시합니다. 분홍색 선은 실제 잔차를 나타냅니다.
두 선이 크게 다른 경우 이는 비선형 관계를 나타냅니다.
위의 그래프에서 x2와 x3의 잔차가 비선형으로 나타나는 것을 볼 수 있습니다.
이는 다중 선형 회귀의 선형성 가정을 위반합니다. 이 문제를 해결하는 한 가지 방법은 예측 변수에 대해 제곱근 또는 3차근 변환을 사용하는 것입니다.
library (car) #fit new model with transformed predictor variables model_transformed <- lm(y~x1+sqrt(x2)+log10(x3^(1/3))) #create partial residual plots for new model crPlots(model_transformed)
부분 잔차 그림에서 이제 x2가 반응 변수와 더 선형적인 관계를 갖고 있음을 알 수 있습니다.
x3 예측 변수는 여전히 다소 비선형적이므로 다른 변환을 시도하거나 모델에서 변수를 완전히 제거하기로 결정할 수 있습니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 플롯을 만드는 방법을 설명합니다.