So berechnen sie rmse in r
Der Root Mean Square Error (RMSE) ist ein Maß, das uns sagt, wie weit unsere vorhergesagten Werte von unseren beobachteten Werten in einer Regressionsanalyse im Durchschnitt entfernt sind. Es wird wie folgt berechnet:
RMSE = √[ Σ(P i – O i ) 2 / n ]
Gold:
- Σ ist ein ausgefallenes Symbol, das „Summe“ bedeutet
- P i ist der vorhergesagte Wert für die i-te Beobachtung im Datensatz
- O i ist der beobachtete Wert für die i-te Beobachtung im Datensatz
- n ist die Stichprobengröße
In diesem Tutorial werden zwei Methoden erläutert, mit denen Sie RMSE in R berechnen können.
Methode 1: Schreiben Sie Ihre eigene Funktion
Angenommen, wir haben einen Datensatz mit einer Spalte, die die tatsächlichen Datenwerte enthält, und einer Spalte, die die vorhergesagten Datenwerte enthält:
#create dataset data <- data.frame(actual=c(34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24), predicted=c(37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23)) #view dataset data actual predicted 1 34 37 2 37 40 3 44 46 4 47 44 5 48 46 6 48 50 7 46 45 8 43 44 9 32 34 10 27 30 11 26 22 12 24 23
Zur Berechnung des RMSE können wir die folgende Funktion verwenden:
#calculate RMSE
sqrt(mean((data$actual - data$predicted)^2))
[1] 2.43242
Der mittlere quadratische Fehler beträgt 2,43242 .
Methode 2: Verwenden Sie ein Paket
Wir könnten den RMSE für denselben Datensatz auch mit der Funktion rmse() aus dem Metrics- Paket berechnen, die die folgende Syntax verwendet:
rmse (tatsächlich, geplant)
Gold:
- real: echte Werte
- vorhergesagt: vorhergesagte Werte
Hier ist die Syntax, die wir in unserem Beispiel verwenden würden:
#load Metrics package library(Metrics) calculate RMSE rmse(data$actual, data$predicted) [1] 2.43242
Der mittlere quadratische Fehler beträgt 2,43242 und entspricht dem, was wir zuvor mit unserer eigenen Funktion berechnet haben.
So interpretieren Sie den RMSE
RMSE ist eine nützliche Methode, um zu sehen, wie gut ein Regressionsmodell an einen Datensatz angepasst werden kann.
Je größer der RMSE, desto größer ist der Unterschied zwischen den vorhergesagten und den beobachteten Werten, d. h. desto schlechter passt das Regressionsmodell an die Daten. Umgekehrt gilt: Je kleiner der RMSE, desto besser kann das Modell die Daten anpassen.
Es kann besonders nützlich sein, den RMSE zweier verschiedener Modelle zu vergleichen, um herauszufinden, welches Modell am besten zu den Daten passt.
Zusätzliche Ressourcen
RMSE-Rechner
So berechnen Sie MSE in R
So berechnen Sie MAPE in R