R에서 다중 선형 회귀 결과를 플롯하는 방법
R에서 단순 선형 회귀를 수행할 때 단일 예측 변수와 단일 응답 변수 로만 작업하기 때문에 적합 회귀선을 시각화하는 것이 쉽습니다.
예를 들어, 다음 코드는 단순 선형 회귀 모델을 데이터 세트에 맞추고 결과를 그리는 방법을 보여줍니다.
#create dataset data <- data.frame(x = c(1, 1, 2, 4, 4, 5, 6, 7, 7, 8, 9, 10, 11, 11), y = c(13, 14, 17, 23, 24, 25, 25, 24, 28, 32, 33, 35, 40, 41)) #fit simple linear regression model model <- lm(y ~ x, data = data) #create scatterplot of data plot(data$x, data$y) #add fitted regression line abline(model)

그러나 다중 선형 회귀를 수행할 경우 예측 변수가 여러 개 있고 단순히 2차원 그래프에 회귀선을 그릴 수 없기 때문에 결과를 시각화하기가 어렵습니다.
대신, 모델에서 다른 예측 변수의 존재를 제어하면서 반응 변수와 예측 변수 사이의 관계를 표시하는 개별 도표인 추가 변수 도표 (“부분 회귀 도표”라고도 함)를 사용할 수 있습니다.
다음 예에서는 R에서 다중 선형 회귀를 수행하고 추가된 변수 플롯을 사용하여 결과를 시각화하는 방법을 보여줍니다.
예: R에 다중 선형 회귀 결과 도표화
내장된 mtcars 데이터 세트를 사용하여 R의 데이터 세트에 다음 다중 선형 회귀 모델을 적용한다고 가정합니다.
#fit multiple linear regression model
model <- lm(mpg ~ disp + hp + drat, data = mtcars)
#view results of model
summary(model)
Call:
lm(formula = mpg ~ disp + hp + drat, data = mtcars)
Residuals:
Min 1Q Median 3Q Max
-5.1225 -1.8454 -0.4456 1.1342 6.4958
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 19.344293 6.370882 3.036 0.00513 **
available -0.019232 0.009371 -2.052 0.04960 *
hp -0.031229 0.013345 -2.340 0.02663 *
drat 2.714975 1.487366 1.825 0.07863 .
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.008 on 28 degrees of freedom
Multiple R-squared: 0.775, Adjusted R-squared: 0.7509
F-statistic: 32.15 on 3 and 28 DF, p-value: 3.28e-09
결과에서 각 계수의 p-값이 0.1보다 작은 것을 알 수 있습니다. 단순화를 위해 각 예측 변수가 중요하며 모델에 포함되어야 한다고 가정합니다.
추가된 변수의 플롯을 생성하려면 car 패키지의 avPlots() 함수를 사용할 수 있습니다.
#load car package
library(car)
#produce added variable plots
avPlots(model)

각 플롯을 해석하는 방법은 다음과 같습니다.
- x축은 단일 예측 변수를 표시하고 y축은 반응 변수를 표시합니다.
- 파란색 선은 다른 모든 예측 변수의 값을 일정하게 유지하면서 예측 변수와 반응 변수 간의 연관성을 보여줍니다.
- 각 그래프의 레이블이 지정된 점은 잔차가 가장 큰 관측치 2개와 부분 레버리지가 가장 큰 관측치 2개를 나타냅니다.
각 플롯의 선 각도는 추정 회귀 방정식 계수의 부호에 해당합니다.
예를 들어, 모델의 각 예측 변수에 대한 추정 계수는 다음과 같습니다.
- 디스플레이: -0.019232
- 채널: -0.031229
- 날짜: 2.714975
선의 각도는 drat 에 대해 추가된 변수 플롯에서 양수인 반면 disp 및 hp 에 대해서는 음수입니다. 이는 추정 계수의 부호에 해당합니다.

여러 예측 변수가 있기 때문에 2D 그래프에 단일 적합 회귀선을 그릴 수는 없지만 이러한 추가된 변수 그래프를 사용하면 다른 예측 변수를 일정하게 유지하면서 각 개별 예측 변수와 반응 변수 간의 관계를 관찰할 수 있습니다.