Jak obliczyć rmse w pythonie
Średni błąd kwadratowy (RMSE) to metryka, która mówi nam, jak średnio nasze przewidywane wartości różnią się od wartości obserwowanych w modelu. Oblicza się go w następujący sposób:
RMSE = √[ Σ(P ja – O ja ) 2 / n ]
Złoto:
- Σ to fantazyjny symbol oznaczający „sumę”
- Pi jest przewidywaną wartością i-tej obserwacji
- O i jest obserwowaną wartością i-tej obserwacji
- n to wielkość próbki
W tym samouczku wyjaśniono prostą metodę obliczania RMSE w Pythonie.
Przykład: Oblicz RMSE w Pythonie
Załóżmy, że mamy następujące tabele wartości rzeczywistych i przewidywanych:
actual= [34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24] pred = [37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23]
Aby obliczyć RMSE między wartościami rzeczywistymi i przewidywanymi, możemy po prostu pobrać pierwiastek kwadratowy funkcji Mean_squared_error() z biblioteki sklearn.metrics:
#import necessary libraries from sklearn.metrics import mean_squared_error from math import sqrt #calculate RMSE sqrt(mean_squared_error(actual, pred)) 2.4324199198
Okazuje się, że RMSE wynosi 2,4324 .
Jak interpretować RMSE
RMSE to przydatny sposób sprawdzenia, jak dobrze model jest w stanie dopasować zbiór danych. Im większy RMSE, tym większa różnica między wartościami przewidywanymi i obserwowanymi, co oznacza, że model gorzej pasuje do danych. I odwrotnie, im mniejszy RMSE, tym lepiej model jest w stanie dopasować dane.
Szczególnie przydatne może być porównanie RMSE dwóch różnych modeli, aby sprawdzić, który model najlepiej pasuje do danych.
Dodatkowe zasoby
Kalkulator RMSE
Jak obliczyć średni błąd kwadratowy (MSE) w Pythonie
Jak obliczyć MAPE w Pythonie