R에서 예측값을 그리는 방법(예제 포함)


예측된 값과 실제 값 사이의 차이를 시각화하기 위해 회귀 모델의 예측된 값을 R로 플롯하려는 경우가 종종 있습니다.

이 튜토리얼에서는 R 및 ggplot2에서 이러한 유형의 플롯을 생성하는 예를 제공합니다.

예시 1: 기본 R에 예측값과 실제값 플롯팅

다음 코드는 R에 다중 선형 회귀 모델을 적용한 다음 예측 값과 실제 값의 플롯을 만드는 방법을 보여줍니다.

 #create data
df <- data. frame (x1=c(3, 4, 4, 5, 5, 6, 7, 8, 11, 12),
                 x2=c(6, 6, 7, 7, 8, 9, 11, 13, 14, 14),
                 y=c(22, 24, 24, 25, 25, 27, 29, 31, 32, 36))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#plot predicted vs. actual values
plot(x=predict(model), y=df$y,
     xlab=' Predicted Values ',
     ylab=' Actual Values ',
     main=' Predicted vs. Actual Values ')

#add diagonal line for estimated regression line
abline(a= 0 , b= 1 )

R에 예측값 그리기

X축은 모델의 예측값을 표시하고 Y축은 데이터세트의 실제값을 표시합니다. 그래프 중앙의 대각선은 추정 회귀선입니다.

각 데이터 포인트가 추정 회귀선에 매우 가깝기 때문에 이는 회귀 모델이 데이터를 상당히 잘 피팅하고 있음을 나타냅니다.

또한 각 데이터 포인트에 대한 실제 값과 예측 값을 표시하는 데이터 프레임을 만들 수도 있습니다.

 #create data frame of actual and predicted values
values <- data. frame (actual=df$y, predicted=predict(model))

#view data frame
values

   actual predicted
1 22 22.54878
2 24 23.56707
3 24 23.96341
4 25 24.98171
5 25 25.37805
6 27 26.79268
7 29 28.60366
8 31 30.41463
9 32 33.86585
10 36 34.88415

예 2: ggplot2에서 예측 값과 실제 값 플롯팅

다음 코드는 ggplot2 데이터 시각화 패키지를 사용하여 예측 값과 실제 값의 플롯을 생성하는 방법을 보여줍니다.

 library (ggplot2) 

#create data
df <- data. frame (x1=c(3, 4, 4, 5, 5, 6, 7, 8, 11, 12),
                 x2=c(6, 6, 7, 7, 8, 9, 11, 13, 14, 14),
                 y=c(22, 24, 24, 25, 25, 27, 29, 31, 32, 36))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#plot predicted vs. actual values
ggplot(df, aes (x=predict(model), y=y)) + 
  geom_point() +
  geom_abline(intercept= 0 , slope= 1 ) +
  labs(x=' Predicted Values ', y=' Actual Values ', title=' Predicted vs. Actual Values ')

이번에도 X축은 모델의 예측값을 나타내고, Y축은 데이터세트의 실제값을 나타냅니다.

추가 리소스

R에서 잔차 플롯을 만드는 방법
R에서 잔차 히스토그램을 만드는 방법
R에서 표준화 잔차를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다