Hoe rmse in python te berekenen


Root Mean Square Error (RMSE) is een metriek die ons vertelt hoe ver onze voorspelde waarden gemiddeld verwijderd zijn van onze waargenomen waarden in een model. Het wordt als volgt berekend:

RMSE = √[ Σ(P ik – O ik ) 2 / n ]

Goud:

  • Σ is een mooi symbool dat ‘som’ betekent
  • Pi is de voorspelde waarde voor de i- de waarneming
  • O i is de waargenomen waarde voor de i- de waarneming
  • n is de steekproefomvang

In deze tutorial wordt een eenvoudige methode uitgelegd om RMSE in Python te berekenen.

Voorbeeld: Bereken RMSE in Python

Stel dat we de volgende tabellen met werkelijke en voorspelde waarden hebben:

 actual= [34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24]
pred = [37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23]

Om de RMSE tussen de werkelijke en voorspelde waarden te berekenen, kunnen we eenvoudigweg de vierkantswortel nemen van de functie Mean_squared_error() uit de sklearn.metrics-bibliotheek:

 #import necessary libraries
from sklearn.metrics import mean_squared_error
from math import sqrt

#calculate RMSE
sqrt(mean_squared_error(actual, pred)) 

2.4324199198

De RMSE blijkt 2.4324 te zijn.

Hoe de RMSE te interpreteren

RMSE is een handige manier om te zien hoe goed een model in een dataset past. Hoe groter de RMSE, hoe groter het verschil tussen de voorspelde en waargenomen waarden, wat betekent dat hoe slechter het model bij de gegevens past. Omgekeerd geldt: hoe kleiner de RMSE, hoe beter het model bij de gegevens kan passen.

Het kan bijzonder nuttig zijn om de RMSE van twee verschillende modellen te vergelijken om te zien welk model het beste bij de gegevens past.

Aanvullende bronnen

RMSE-calculator
Hoe de gemiddelde kwadratische fout (MSE) in Python te berekenen
Hoe MAPE in Python te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert