R에서 다중 선형 회귀 결과를 플롯하는 방법


R에서 단순 선형 회귀를 수행할 때 단일 예측 변수와 단일 응답 변수 로만 작업하기 때문에 적합 회귀선을 시각화하는 것이 쉽습니다.

예를 들어, 다음 코드는 단순 선형 회귀 모델을 데이터 세트에 맞추고 결과를 그리는 방법을 보여줍니다.

 #create dataset
data <- data.frame(x = c(1, 1, 2, 4, 4, 5, 6, 7, 7, 8, 9, 10, 11, 11),
                   y = c(13, 14, 17, 23, 24, 25, 25, 24, 28, 32, 33, 35, 40, 41))

#fit simple linear regression model
model <- lm(y ~ x, data = data)

#create scatterplot of data
plot(data$x, data$y)

#add fitted regression line
abline(model)

산점도를 사용하여 R에 간단한 선형 회귀선 그리기

그러나 다중 선형 회귀를 수행할 경우 예측 변수가 여러 개 있고 단순히 2차원 그래프에 회귀선을 그릴 수 없기 때문에 결과를 시각화하기가 어렵습니다.

대신, 모델에서 다른 예측 변수의 존재를 제어하면서 반응 변수와 예측 변수 사이의 관계를 표시하는 개별 도표인 추가 변수 도표 (“부분 회귀 도표”라고도 함)를 사용할 수 있습니다.

다음 예에서는 R에서 다중 선형 회귀를 수행하고 추가된 변수 플롯을 사용하여 결과를 시각화하는 방법을 보여줍니다.

예: R에 다중 선형 회귀 결과 도표화

내장된 mtcars 데이터 세트를 사용하여 R의 데이터 세트에 다음 다중 선형 회귀 모델을 적용한다고 가정합니다.

 #fit multiple linear regression model
model <- lm(mpg ~ disp + hp + drat, data = mtcars)

#view results of model
summary(model)

Call:
lm(formula = mpg ~ disp + hp + drat, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-5.1225 -1.8454 -0.4456 1.1342 6.4958 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)   
(Intercept) 19.344293 6.370882 3.036 0.00513 **
available -0.019232 0.009371 -2.052 0.04960 * 
hp -0.031229 0.013345 -2.340 0.02663 * 
drat 2.714975 1.487366 1.825 0.07863 . 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.008 on 28 degrees of freedom
Multiple R-squared: 0.775, Adjusted R-squared: 0.7509 
F-statistic: 32.15 on 3 and 28 DF, p-value: 3.28e-09

결과에서 각 계수의 p-값이 0.1보다 작은 것을 알 수 있습니다. 단순화를 위해 각 예측 변수가 중요하며 모델에 포함되어야 한다고 가정합니다.

추가된 변수의 플롯을 생성하려면 car 패키지의 avPlots() 함수를 사용할 수 있습니다.

 #load car package
library(car)

#produce added variable plots
avPlots(model)

R에 다중 선형 회귀 그리기

각 플롯을 해석하는 방법은 다음과 같습니다.

  • x축은 단일 예측 변수를 표시하고 y축은 반응 변수를 표시합니다.
  • 파란색 선은 다른 모든 예측 변수의 값을 일정하게 유지하면서 예측 변수와 반응 변수 간의 연관성을 보여줍니다.
  • 각 그래프의 레이블이 지정된 점은 잔차가 가장 큰 관측치 2개와 부분 레버리지가 가장 큰 관측치 2개를 나타냅니다.

각 플롯의 선 각도는 추정 회귀 방정식 계수의 부호에 해당합니다.

예를 들어, 모델의 각 예측 변수에 대한 추정 계수는 다음과 같습니다.

  • 디스플레이: -0.019232
  • 채널: -0.031229
  • 날짜: 2.714975

선의 각도는 drat 에 대해 추가된 변수 플롯에서 양수인 반면 disphp 에 대해서는 음수입니다. 이는 추정 계수의 부호에 해당합니다.

R에 변수 플롯 추가

여러 예측 변수가 있기 때문에 2D 그래프에 단일 적합 회귀선을 그릴 수는 없지만 이러한 추가된 변수 그래프를 사용하면 다른 예측 변수를 일정하게 유지하면서 각 개별 예측 변수와 반응 변수 간의 관계를 관찰할 수 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다