So berechnen sie rmse in r


Der Root Mean Square Error (RMSE) ist ein Maß, das uns sagt, wie weit unsere vorhergesagten Werte von unseren beobachteten Werten in einer Regressionsanalyse im Durchschnitt entfernt sind. Es wird wie folgt berechnet:

RMSE = √[ Σ(P i – O i ) 2 / n ]

Gold:

  • Σ ist ein ausgefallenes Symbol, das „Summe“ bedeutet
  • P i ist der vorhergesagte Wert für die i-te Beobachtung im Datensatz
  • O i ist der beobachtete Wert für die i-te Beobachtung im Datensatz
  • n ist die Stichprobengröße

In diesem Tutorial werden zwei Methoden erläutert, mit denen Sie RMSE in R berechnen können.

Methode 1: Schreiben Sie Ihre eigene Funktion

Angenommen, wir haben einen Datensatz mit einer Spalte, die die tatsächlichen Datenwerte enthält, und einer Spalte, die die vorhergesagten Datenwerte enthält:

 #create dataset
data <- data.frame(actual=c(34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24),
                   predicted=c(37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23))

#view dataset
data

   actual predicted
1 34 37
2 37 40
3 44 46
4 47 44
5 48 46
6 48 50
7 46 45
8 43 44
9 32 34
10 27 30
11 26 22
12 24 23

Zur Berechnung des RMSE können wir die folgende Funktion verwenden:

 #calculate RMSE
sqrt(mean((data$actual - data$predicted)^2))

[1] 2.43242

Der mittlere quadratische Fehler beträgt 2,43242 .

Methode 2: Verwenden Sie ein Paket

Wir könnten den RMSE für denselben Datensatz auch mit der Funktion rmse() aus dem Metrics- Paket berechnen, die die folgende Syntax verwendet:

rmse (tatsächlich, geplant)

Gold:

  • real: echte Werte
  • vorhergesagt: vorhergesagte Werte

Hier ist die Syntax, die wir in unserem Beispiel verwenden würden:

 #load Metrics package
library(Metrics)

calculate RMSE
rmse(data$actual, data$predicted)

[1] 2.43242

Der mittlere quadratische Fehler beträgt 2,43242 und entspricht dem, was wir zuvor mit unserer eigenen Funktion berechnet haben.

So interpretieren Sie den RMSE

RMSE ist eine nützliche Methode, um zu sehen, wie gut ein Regressionsmodell an einen Datensatz angepasst werden kann.

Je größer der RMSE, desto größer ist der Unterschied zwischen den vorhergesagten und den beobachteten Werten, d. h. desto schlechter passt das Regressionsmodell an die Daten. Umgekehrt gilt: Je kleiner der RMSE, desto besser kann das Modell die Daten anpassen.

Es kann besonders nützlich sein, den RMSE zweier verschiedener Modelle zu vergleichen, um herauszufinden, welches Modell am besten zu den Daten passt.

Zusätzliche Ressourcen

RMSE-Rechner
So berechnen Sie MSE in R
So berechnen Sie MAPE in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert