So zeichnen sie vorhergesagte werte in r auf (mit beispielen)


Häufig möchten Sie möglicherweise die vorhergesagten Werte eines Regressionsmodells in R darstellen, um die Unterschiede zwischen den vorhergesagten Werten und den tatsächlichen Werten zu visualisieren.

Dieses Tutorial bietet Beispiele für die Erstellung dieser Art von Plot in R und ggplot2.

Beispiel 1: Darstellung vorhergesagter und tatsächlicher Werte in Basis R

Der folgende Code zeigt, wie man ein multiples lineares Regressionsmodell in R anpasst und dann ein Diagramm der vorhergesagten und tatsächlichen Werte erstellt:

 #create data
df <- data. frame (x1=c(3, 4, 4, 5, 5, 6, 7, 8, 11, 12),
                 x2=c(6, 6, 7, 7, 8, 9, 11, 13, 14, 14),
                 y=c(22, 24, 24, 25, 25, 27, 29, 31, 32, 36))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#plot predicted vs. actual values
plot(x=predict(model), y=df$y,
     xlab=' Predicted Values ',
     ylab=' Actual Values ',
     main=' Predicted vs. Actual Values ')

#add diagonal line for estimated regression line
abline(a= 0 , b= 1 )

Zeichnen vorhergesagter Werte in R

Die X-Achse zeigt die vorhergesagten Werte des Modells und die Y-Achse die tatsächlichen Werte des Datensatzes. Die diagonale Linie in der Mitte des Diagramms ist die geschätzte Regressionslinie.

Da jeder der Datenpunkte ziemlich nahe an der geschätzten Regressionslinie liegt, zeigt uns dies, dass das Regressionsmodell die Daten ziemlich gut anpasst.

Wir können auch einen Datenrahmen erstellen, der die tatsächlichen und vorhergesagten Werte für jeden Datenpunkt anzeigt:

 #create data frame of actual and predicted values
values <- data. frame (actual=df$y, predicted=predict(model))

#view data frame
values

   actual predicted
1 22 22.54878
2 24 23.56707
3 24 23.96341
4 25 24.98171
5 25 25.37805
6 27 26.79268
7 29 28.60366
8 31 30.41463
9 32 33.86585
10 36 34.88415

Beispiel 2: Darstellung vorhergesagter und tatsächlicher Werte in ggplot2

Der folgende Code zeigt, wie man mit dem Datenvisualisierungspaket ggplot2 ein Diagramm der vorhergesagten und tatsächlichen Werte erstellt:

 library (ggplot2) 

#create data
df <- data. frame (x1=c(3, 4, 4, 5, 5, 6, 7, 8, 11, 12),
                 x2=c(6, 6, 7, 7, 8, 9, 11, 13, 14, 14),
                 y=c(22, 24, 24, 25, 25, 27, 29, 31, 32, 36))

#fit multiple linear regression model
model <- lm(y ~ x1 + x2, data=df)

#plot predicted vs. actual values
ggplot(df, aes (x=predict(model), y=y)) + 
  geom_point() +
  geom_abline(intercept= 0 , slope= 1 ) +
  labs(x=' Predicted Values ', y=' Actual Values ', title=' Predicted vs. Actual Values ')

Auch hier zeigt die X-Achse die vorhergesagten Werte des Modells und die Y-Achse die tatsächlichen Werte des Datensatzes.

Zusätzliche Ressourcen

So erstellen Sie ein Residuendiagramm in R
So erstellen Sie ein Histogramm von Residuen in R
So berechnen Sie standardisierte Residuen in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert