Hoe rmse in r te berekenen


De root mean square error (RMSE) is een maatstaf die ons vertelt hoe ver onze voorspelde waarden gemiddeld afwijken van onze waargenomen waarden in een regressieanalyse. Het wordt als volgt berekend:

RMSE = √[ Σ(P ik – O ik ) 2 / n ]

Goud:

  • Σ is een mooi symbool dat ‘som’ betekent
  • Pi is de voorspelde waarde voor de i- de waarneming in de dataset
  • O i is de waargenomen waarde voor de i- de waarneming in de dataset
  • n is de steekproefomvang

In deze tutorial worden twee methoden uitgelegd die u kunt gebruiken om RMSE in R te berekenen.

Methode 1: Schrijf uw eigen functie

Stel dat we een dataset hebben met een kolom met daarin de werkelijke datawaarden en een kolom met de voorspelde datawaarden:

 #create dataset
data <- data.frame(actual=c(34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24),
                   predicted=c(37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23))

#view dataset
data

   actual predicted
1 34 37
2 37 40
3 44 46
4 47 44
5 48 46
6 48 50
7 46 45
8 43 44
9 32 34
10 27 30
11 26 22
12 24 23

Om de RMSE te berekenen, kunnen we de volgende functie gebruiken:

 #calculate RMSE
sqrt(mean((data$actual - data$predicted)^2))

[1] 2.43242

De gemiddelde kwadratische fout is 2,43242 .

Methode 2: Gebruik een pakket

We kunnen ook de RMSE voor dezelfde gegevensset berekenen met behulp van de functie rmse() uit het Metrics- pakket, dat de volgende syntaxis gebruikt:

rmse (werkelijk, gepland)

Goud:

  • echt: echte waarden
  • voorspeld: voorspelde waarden

Dit is de syntaxis die we in ons voorbeeld zouden gebruiken:

 #load Metrics package
library(Metrics)

calculate RMSE
rmse(data$actual, data$predicted)

[1] 2.43242

De gemiddelde kwadratische fout is 2.43242 , wat overeenkomt met wat we eerder hebben berekend met behulp van onze eigen functie.

Hoe de RMSE te interpreteren

RMSE is een handige manier om te zien hoe goed een regressiemodel in een dataset past.

Hoe groter de RMSE, hoe groter het verschil tussen de voorspelde en waargenomen waarden, wat betekent dat hoe slechter het regressiemodel bij de gegevens past. Omgekeerd geldt: hoe kleiner de RMSE, hoe beter het model in de gegevens kan passen.

Het kan bijzonder nuttig zijn om de RMSE van twee verschillende modellen te vergelijken om te zien welk model het beste bij de gegevens past.

Aanvullende bronnen

RMSE-calculator
Hoe MSE in R te berekenen
Hoe MAPE in R te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert