Hoe rmse in r te berekenen
De root mean square error (RMSE) is een maatstaf die ons vertelt hoe ver onze voorspelde waarden gemiddeld afwijken van onze waargenomen waarden in een regressieanalyse. Het wordt als volgt berekend:
RMSE = √[ Σ(P ik – O ik ) 2 / n ]
Goud:
- Σ is een mooi symbool dat ‘som’ betekent
- Pi is de voorspelde waarde voor de i- de waarneming in de dataset
- O i is de waargenomen waarde voor de i- de waarneming in de dataset
- n is de steekproefomvang
In deze tutorial worden twee methoden uitgelegd die u kunt gebruiken om RMSE in R te berekenen.
Methode 1: Schrijf uw eigen functie
Stel dat we een dataset hebben met een kolom met daarin de werkelijke datawaarden en een kolom met de voorspelde datawaarden:
#create dataset data <- data.frame(actual=c(34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24), predicted=c(37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23)) #view dataset data actual predicted 1 34 37 2 37 40 3 44 46 4 47 44 5 48 46 6 48 50 7 46 45 8 43 44 9 32 34 10 27 30 11 26 22 12 24 23
Om de RMSE te berekenen, kunnen we de volgende functie gebruiken:
#calculate RMSE
sqrt(mean((data$actual - data$predicted)^2))
[1] 2.43242
De gemiddelde kwadratische fout is 2,43242 .
Methode 2: Gebruik een pakket
We kunnen ook de RMSE voor dezelfde gegevensset berekenen met behulp van de functie rmse() uit het Metrics- pakket, dat de volgende syntaxis gebruikt:
rmse (werkelijk, gepland)
Goud:
- echt: echte waarden
- voorspeld: voorspelde waarden
Dit is de syntaxis die we in ons voorbeeld zouden gebruiken:
#load Metrics package library(Metrics) calculate RMSE rmse(data$actual, data$predicted) [1] 2.43242
De gemiddelde kwadratische fout is 2.43242 , wat overeenkomt met wat we eerder hebben berekend met behulp van onze eigen functie.
Hoe de RMSE te interpreteren
RMSE is een handige manier om te zien hoe goed een regressiemodel in een dataset past.
Hoe groter de RMSE, hoe groter het verschil tussen de voorspelde en waargenomen waarden, wat betekent dat hoe slechter het regressiemodel bij de gegevens past. Omgekeerd geldt: hoe kleiner de RMSE, hoe beter het model in de gegevens kan passen.
Het kan bijzonder nuttig zijn om de RMSE van twee verschillende modellen te vergelijken om te zien welk model het beste bij de gegevens past.
Aanvullende bronnen
RMSE-calculator
Hoe MSE in R te berekenen
Hoe MAPE in R te berekenen