R에서 추가된 변수 플롯을 만드는 방법
통계에서 추가 변수 도표는 다중 선형 회귀 모형에서 반응 변수 와 예측 변수 사이의 관계를 표시하는 동시에 모형에 있는 다른 예측 변수의 존재를 제어하는 개별 도표입니다.
참고: 이러한 도표를 “부분 회귀 도표”라고도 합니다.
이러한 유형의 플롯을 사용하면 다른 예측 변수를 일정하게 유지하면서 각 개별 예측 변수와 모델의 응답 변수 간의 관계를 관찰할 수 있습니다.
R에 추가된 변수의 플롯을 생성하려면 car 패키지의 avPlots() 함수를 사용할 수 있습니다.
#load car package library (car) #fit multiple linear regression model model <- lm(y ~ x1 + x2 + ..., data = df) #create added variable plots avPlots(model)
다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.
예: R에 변수 도표 추가
mtcars 데이터세트의 데이터를 사용하여 R에 다음과 같은 다중 선형 회귀 모델을 적합하다고 가정합니다.
#fit multiple linear regression model model <- lm(mpg ~ disp + hp + drat, data = mtcars) #view summary of model summary(model) Call: lm(formula = mpg ~ disp + hp + drat, data = mtcars) Residuals: Min 1Q Median 3Q Max -5.1225 -1.8454 -0.4456 1.1342 6.4958 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 19.344293 6.370882 3.036 0.00513 ** available -0.019232 0.009371 -2.052 0.04960 * hp -0.031229 0.013345 -2.340 0.02663 * drat 2.714975 1.487366 1.825 0.07863 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.008 on 28 degrees of freedom Multiple R-squared: 0.775, Adjusted R-squared: 0.7509 F-statistic: 32.15 on 3 and 28 DF, p-value: 3.28e-09
응답 변수 “mpg”와 모델의 각 개별 예측 변수 간의 관계를 시각화하기 위해 avPlots() 함수를 사용하여 추가된 변수의 플롯을 생성할 수 있습니다.
#load car package
library (car)
#produce added variable plots
avPlots(model)
각 플롯을 해석하는 방법은 다음과 같습니다.
- x축은 단일 예측 변수를 표시하고 y축은 반응 변수를 표시합니다.
- 파란색 선은 다른 모든 예측 변수의 값을 일정하게 유지하면서 예측 변수와 반응 변수 간의 연관성을 보여줍니다.
- 각 그래프의 레이블이 지정된 점은 잔차가 가장 큰 두 관측치와 부분 레버리지가 가장 큰 두 관측치를 나타냅니다.
각 플롯의 선 각도는 추정 회귀 방정식 계수의 부호에 해당합니다.
예를 들어, 모델의 각 예측 변수에 대한 추정 계수는 다음과 같습니다.
- 디스플레이: -0.019232
- 채널: -0.031229
- 날짜: 2.714975
선의 각도는 drat 에 대해 추가된 변수 플롯에서 양수인 반면 disp 및 hp 에 대해서는 음수입니다. 이는 추정 계수의 부호에 해당합니다.
이 그래프를 사용하면 각 개별 예측 변수와 반응 변수 간의 관계를 쉽게 시각화할 수 있습니다.
추가 리소스
R에서 단순 선형 회귀를 수행하는 방법
R에서 다중 선형 회귀를 수행하는 방법
R에서 로지스틱 회귀를 수행하는 방법