So zeichnen sie vorhergesagte werte in r auf (mit beispielen)
Häufig möchten Sie möglicherweise die vorhergesagten Werte eines Regressionsmodells in R darstellen, um die Unterschiede zwischen den vorhergesagten Werten und den tatsächlichen Werten zu visualisieren.
Dieses Tutorial bietet Beispiele für die Erstellung dieser Art von Plot in R und ggplot2.
Beispiel 1: Darstellung vorhergesagter und tatsächlicher Werte in Basis R
Der folgende Code zeigt, wie man ein multiples lineares Regressionsmodell in R anpasst und dann ein Diagramm der vorhergesagten und tatsächlichen Werte erstellt:
#create data df <- data. frame (x1=c(3, 4, 4, 5, 5, 6, 7, 8, 11, 12), x2=c(6, 6, 7, 7, 8, 9, 11, 13, 14, 14), y=c(22, 24, 24, 25, 25, 27, 29, 31, 32, 36)) #fit multiple linear regression model model <- lm(y ~ x1 + x2, data=df) #plot predicted vs. actual values plot(x=predict(model), y=df$y, xlab=' Predicted Values ', ylab=' Actual Values ', main=' Predicted vs. Actual Values ') #add diagonal line for estimated regression line abline(a= 0 , b= 1 )
Die X-Achse zeigt die vorhergesagten Werte des Modells und die Y-Achse die tatsächlichen Werte des Datensatzes. Die diagonale Linie in der Mitte des Diagramms ist die geschätzte Regressionslinie.
Da jeder der Datenpunkte ziemlich nahe an der geschätzten Regressionslinie liegt, zeigt uns dies, dass das Regressionsmodell die Daten ziemlich gut anpasst.
Wir können auch einen Datenrahmen erstellen, der die tatsächlichen und vorhergesagten Werte für jeden Datenpunkt anzeigt:
#create data frame of actual and predicted values values <- data. frame (actual=df$y, predicted=predict(model)) #view data frame values actual predicted 1 22 22.54878 2 24 23.56707 3 24 23.96341 4 25 24.98171 5 25 25.37805 6 27 26.79268 7 29 28.60366 8 31 30.41463 9 32 33.86585 10 36 34.88415
Beispiel 2: Darstellung vorhergesagter und tatsächlicher Werte in ggplot2
Der folgende Code zeigt, wie man mit dem Datenvisualisierungspaket ggplot2 ein Diagramm der vorhergesagten und tatsächlichen Werte erstellt:
library (ggplot2) #create data df <- data. frame (x1=c(3, 4, 4, 5, 5, 6, 7, 8, 11, 12), x2=c(6, 6, 7, 7, 8, 9, 11, 13, 14, 14), y=c(22, 24, 24, 25, 25, 27, 29, 31, 32, 36)) #fit multiple linear regression model model <- lm(y ~ x1 + x2, data=df) #plot predicted vs. actual values ggplot(df, aes (x=predict(model), y=y)) + geom_point() + geom_abline(intercept= 0 , slope= 1 ) + labs(x=' Predicted Values ', y=' Actual Values ', title=' Predicted vs. Actual Values ')
Auch hier zeigt die X-Achse die vorhergesagten Werte des Modells und die Y-Achse die tatsächlichen Werte des Datensatzes.
Zusätzliche Ressourcen
So erstellen Sie ein Residuendiagramm in R
So erstellen Sie ein Histogramm von Residuen in R
So berechnen Sie standardisierte Residuen in R