Як обчислити rmse в python
Середньоквадратична помилка (RMSE) — це показник, який повідомляє нам, наскільки далекі наші прогнозовані значення в середньому від наших спостережуваних значень у моделі. Він розраховується таким чином:
RMSE = √[ Σ(P i – O i ) 2 / n ]
золото:
- Σ – химерний символ, що означає «сума»
- P i – прогнозоване значення для i-го спостереження
- O i – спостережене значення для i-го спостереження
- n – розмір вибірки
Цей підручник пояснює простий метод обчислення RMSE у Python.
Приклад: обчисліть RMSE у Python
Припустимо, що ми маємо такі таблиці фактичних і прогнозованих значень:
actual= [34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24] pred = [37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23]
Щоб обчислити RMSE між фактичним і прогнозованим значеннями, ми можемо просто взяти квадратний корінь із функції Mean_squared_error() із бібліотеки sklearn.metrics:
#import necessary libraries from sklearn.metrics import mean_squared_error from math import sqrt #calculate RMSE sqrt(mean_squared_error(actual, pred)) 2.4324199198
RMSE виявляється 2,4324 .
Як інтерпретувати RMSE
RMSE — це корисний спосіб побачити, наскільки модель здатна відповідати набору даних. Чим більше RMSE, тим більша різниця між прогнозованими та спостережуваними значеннями, тобто тим гірше модель відповідає даним. Навпаки, чим менший RMSE, тим краще модель може відповідати даним.
Особливо корисним може бути порівняння RMSE двох різних моделей, щоб побачити, яка модель найкраще відповідає даним.
Додаткові ресурси
Калькулятор RMSE
Як обчислити середню квадратичну помилку (MSE) у Python
Як розрахувати MAPE в Python