R'de tahmin edilen değerler nasıl çizilir (örneklerle)
Tahmin edilen değerler ile gerçek değerler arasındaki farkları görselleştirmek için çoğu zaman bir regresyon modelinin tahmin edilen değerlerini R’de çizmek isteyebilirsiniz.
Bu eğitimde, R ve ggplot2’de bu tür grafiğin oluşturulmasına ilişkin örnekler verilmektedir.
Örnek 1: Tahmin edilen ve gerçek değerlerin R tabanında çizilmesi
Aşağıdaki kod, R’ye çoklu doğrusal regresyon modelinin nasıl sığdırılacağını ve ardından tahmin edilen ve gerçek değerlerin grafiğinin nasıl oluşturulacağını gösterir:
#create data df <- data. frame (x1=c(3, 4, 4, 5, 5, 6, 7, 8, 11, 12), x2=c(6, 6, 7, 7, 8, 9, 11, 13, 14, 14), y=c(22, 24, 24, 25, 25, 27, 29, 31, 32, 36)) #fit multiple linear regression model model <- lm(y ~ x1 + x2, data=df) #plot predicted vs. actual values plot(x=predict(model), y=df$y, xlab=' Predicted Values ', ylab=' Actual Values ', main=' Predicted vs. Actual Values ') #add diagonal line for estimated regression line abline(a= 0 , b= 1 )
X ekseni modelden tahmin edilen değerleri, Y ekseni ise veri kümesindeki gerçek değerleri görüntüler. Grafiğin ortasındaki çapraz çizgi, tahmini regresyon çizgisidir.
Veri noktalarının her biri tahmini regresyon çizgisine oldukça yakın olduğundan, bu bize regresyon modelinin verileri uydurma konusunda oldukça iyi bir iş çıkardığını gösterir.
Ayrıca her veri noktası için gerçek ve tahmin edilen değerleri görüntüleyen bir veri çerçevesi de oluşturabiliriz:
#create data frame of actual and predicted values values <- data. frame (actual=df$y, predicted=predict(model)) #view data frame values actual predicted 1 22 22.54878 2 24 23.56707 3 24 23.96341 4 25 24.98171 5 25 25.37805 6 27 26.79268 7 29 28.60366 8 31 30.41463 9 32 33.86585 10 36 34.88415
Örnek 2: ggplot2’de Tahmin Edilen ve Gerçek Değerlerin Grafiklendirilmesi
Aşağıdaki kod, ggplot2 veri görselleştirme paketini kullanarak tahmin edilen ve gerçek değerlerin grafiğinin nasıl oluşturulacağını gösterir:
library (ggplot2) #create data df <- data. frame (x1=c(3, 4, 4, 5, 5, 6, 7, 8, 11, 12), x2=c(6, 6, 7, 7, 8, 9, 11, 13, 14, 14), y=c(22, 24, 24, 25, 25, 27, 29, 31, 32, 36)) #fit multiple linear regression model model <- lm(y ~ x1 + x2, data=df) #plot predicted vs. actual values ggplot(df, aes (x=predict(model), y=y)) + geom_point() + geom_abline(intercept= 0 , slope= 1 ) + labs(x=' Predicted Values ', y=' Actual Values ', title=' Predicted vs. Actual Values ')
Yine X ekseni modelden tahmin edilen değerleri, Y ekseni ise veri kümesinden alınan gerçek değerleri gösterir.
Ek kaynaklar
R’de artık arsa nasıl oluşturulur
R’de artıkların histogramı nasıl oluşturulur
R’de standartlaştırılmış artıklar nasıl hesaplanır