R에서 예측값을 그리는 방법(예제 포함)
예측된 값과 실제 값 사이의 차이를 시각화하기 위해 회귀 모델의 예측된 값을 R로 플롯하려는 경우가 종종 있습니다.
이 튜토리얼에서는 R 및 ggplot2에서 이러한 유형의 플롯을 생성하는 예를 제공합니다.
예시 1: 기본 R에 예측값과 실제값 플롯팅
다음 코드는 R에 다중 선형 회귀 모델을 적용한 다음 예측 값과 실제 값의 플롯을 만드는 방법을 보여줍니다.
#create data df <- data. frame (x1=c(3, 4, 4, 5, 5, 6, 7, 8, 11, 12), x2=c(6, 6, 7, 7, 8, 9, 11, 13, 14, 14), y=c(22, 24, 24, 25, 25, 27, 29, 31, 32, 36)) #fit multiple linear regression model model <- lm(y ~ x1 + x2, data=df) #plot predicted vs. actual values plot(x=predict(model), y=df$y, xlab=' Predicted Values ', ylab=' Actual Values ', main=' Predicted vs. Actual Values ') #add diagonal line for estimated regression line abline(a= 0 , b= 1 )

X축은 모델의 예측값을 표시하고 Y축은 데이터세트의 실제값을 표시합니다. 그래프 중앙의 대각선은 추정 회귀선입니다.
각 데이터 포인트가 추정 회귀선에 매우 가깝기 때문에 이는 회귀 모델이 데이터를 상당히 잘 피팅하고 있음을 나타냅니다.
또한 각 데이터 포인트에 대한 실제 값과 예측 값을 표시하는 데이터 프레임을 만들 수도 있습니다.
#create data frame of actual and predicted values values <- data. frame (actual=df$y, predicted=predict(model)) #view data frame values actual predicted 1 22 22.54878 2 24 23.56707 3 24 23.96341 4 25 24.98171 5 25 25.37805 6 27 26.79268 7 29 28.60366 8 31 30.41463 9 32 33.86585 10 36 34.88415
예 2: ggplot2에서 예측 값과 실제 값 플롯팅
다음 코드는 ggplot2 데이터 시각화 패키지를 사용하여 예측 값과 실제 값의 플롯을 생성하는 방법을 보여줍니다.
library (ggplot2) #create data df <- data. frame (x1=c(3, 4, 4, 5, 5, 6, 7, 8, 11, 12), x2=c(6, 6, 7, 7, 8, 9, 11, 13, 14, 14), y=c(22, 24, 24, 25, 25, 27, 29, 31, 32, 36)) #fit multiple linear regression model model <- lm(y ~ x1 + x2, data=df) #plot predicted vs. actual values ggplot(df, aes (x=predict(model), y=y)) + geom_point() + geom_abline(intercept= 0 , slope= 1 ) + labs(x=' Predicted Values ', y=' Actual Values ', title=' Predicted vs. Actual Values ')

이번에도 X축은 모델의 예측값을 나타내고, Y축은 데이터세트의 실제값을 나타냅니다.