Hoe rmse in python te berekenen
Root Mean Square Error (RMSE) is een metriek die ons vertelt hoe ver onze voorspelde waarden gemiddeld verwijderd zijn van onze waargenomen waarden in een model. Het wordt als volgt berekend:
RMSE = √[ Σ(P ik – O ik ) 2 / n ]
Goud:
- Σ is een mooi symbool dat ‘som’ betekent
- Pi is de voorspelde waarde voor de i- de waarneming
- O i is de waargenomen waarde voor de i- de waarneming
- n is de steekproefomvang
In deze tutorial wordt een eenvoudige methode uitgelegd om RMSE in Python te berekenen.
Voorbeeld: Bereken RMSE in Python
Stel dat we de volgende tabellen met werkelijke en voorspelde waarden hebben:
actual= [34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24] pred = [37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23]
Om de RMSE tussen de werkelijke en voorspelde waarden te berekenen, kunnen we eenvoudigweg de vierkantswortel nemen van de functie Mean_squared_error() uit de sklearn.metrics-bibliotheek:
#import necessary libraries from sklearn.metrics import mean_squared_error from math import sqrt #calculate RMSE sqrt(mean_squared_error(actual, pred)) 2.4324199198
De RMSE blijkt 2.4324 te zijn.
Hoe de RMSE te interpreteren
RMSE is een handige manier om te zien hoe goed een model in een dataset past. Hoe groter de RMSE, hoe groter het verschil tussen de voorspelde en waargenomen waarden, wat betekent dat hoe slechter het model bij de gegevens past. Omgekeerd geldt: hoe kleiner de RMSE, hoe beter het model bij de gegevens kan passen.
Het kan bijzonder nuttig zijn om de RMSE van twee verschillende modellen te vergelijken om te zien welk model het beste bij de gegevens past.
Aanvullende bronnen
RMSE-calculator
Hoe de gemiddelde kwadratische fout (MSE) in Python te berekenen
Hoe MAPE in Python te berekenen