Як обчислити rmse в python


Середньоквадратична помилка (RMSE) — це показник, який повідомляє нам, наскільки далекі наші прогнозовані значення в середньому від наших спостережуваних значень у моделі. Він розраховується таким чином:

RMSE = √[ Σ(P i – O i ) 2 / n ]

золото:

  • Σ – химерний символ, що означає «сума»
  • P i – прогнозоване значення для i-го спостереження
  • O i – спостережене значення для i-го спостереження
  • n – розмір вибірки

Цей підручник пояснює простий метод обчислення RMSE у Python.

Приклад: обчисліть RMSE у Python

Припустимо, що ми маємо такі таблиці фактичних і прогнозованих значень:

 actual= [34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24]
pred = [37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23]

Щоб обчислити RMSE між фактичним і прогнозованим значеннями, ми можемо просто взяти квадратний корінь із функції Mean_squared_error() із бібліотеки sklearn.metrics:

 #import necessary libraries
from sklearn.metrics import mean_squared_error
from math import sqrt

#calculate RMSE
sqrt(mean_squared_error(actual, pred)) 

2.4324199198

RMSE виявляється 2,4324 .

Як інтерпретувати RMSE

RMSE — це корисний спосіб побачити, наскільки модель здатна відповідати набору даних. Чим більше RMSE, тим більша різниця між прогнозованими та спостережуваними значеннями, тобто тим гірше модель відповідає даним. Навпаки, чим менший RMSE, тим краще модель може відповідати даним.

Особливо корисним може бути порівняння RMSE двох різних моделей, щоб побачити, яка модель найкраще відповідає даним.

Додаткові ресурси

Калькулятор RMSE
Як обчислити середню квадратичну помилку (MSE) у Python
Як розрахувати MAPE в Python

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *