Jak obliczyć rmse w pythonie


Średni błąd kwadratowy (RMSE) to metryka, która mówi nam, jak średnio nasze przewidywane wartości różnią się od wartości obserwowanych w modelu. Oblicza się go w następujący sposób:

RMSE = √[ Σ(P ja – O ja ) 2 / n ]

Złoto:

  • Σ to fantazyjny symbol oznaczający „sumę”
  • Pi jest przewidywaną wartością i-tej obserwacji
  • O i jest obserwowaną wartością i-tej obserwacji
  • n to wielkość próbki

W tym samouczku wyjaśniono prostą metodę obliczania RMSE w Pythonie.

Przykład: Oblicz RMSE w Pythonie

Załóżmy, że mamy następujące tabele wartości rzeczywistych i przewidywanych:

 actual= [34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24]
pred = [37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23]

Aby obliczyć RMSE między wartościami rzeczywistymi i przewidywanymi, możemy po prostu pobrać pierwiastek kwadratowy funkcji Mean_squared_error() z biblioteki sklearn.metrics:

 #import necessary libraries
from sklearn.metrics import mean_squared_error
from math import sqrt

#calculate RMSE
sqrt(mean_squared_error(actual, pred)) 

2.4324199198

Okazuje się, że RMSE wynosi 2,4324 .

Jak interpretować RMSE

RMSE to przydatny sposób sprawdzenia, jak dobrze model jest w stanie dopasować zbiór danych. Im większy RMSE, tym większa różnica między wartościami przewidywanymi i obserwowanymi, co oznacza, że model gorzej pasuje do danych. I odwrotnie, im mniejszy RMSE, tym lepiej model jest w stanie dopasować dane.

Szczególnie przydatne może być porównanie RMSE dwóch różnych modeli, aby sprawdzić, który model najlepiej pasuje do danych.

Dodatkowe zasoby

Kalkulator RMSE
Jak obliczyć średni błąd kwadratowy (MSE) w Pythonie
Jak obliczyć MAPE w Pythonie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *