Как рассчитать rmse в python
Среднеквадратическая ошибка (RMSE) — это показатель, который говорит нам, насколько в среднем далеки наши прогнозируемые значения от наблюдаемых значений в модели. Он рассчитывается следующим образом:
RMSE знак равно √[ Σ(P i – O i ) 2 / n ]
Золото:
- Σ — причудливый символ, означающий «сумма».
- Pi — прогнозируемое значение для i-го наблюдения.
- O i — наблюдаемое значение для i-го наблюдения
- n — размер выборки
В этом руководстве объясняется простой метод расчета RMSE в Python.
Пример: вычисление RMSE в Python
Предположим, у нас есть следующие таблицы фактических и прогнозируемых значений:
actual= [34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24] pred = [37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23]
Чтобы вычислить RMSE между фактическими и прогнозируемыми значениями, мы можем просто извлечь квадратный корень из функции Mean_squared_error() из библиотеки sklearn.metrics:
#import necessary libraries from sklearn.metrics import mean_squared_error from math import sqrt #calculate RMSE sqrt(mean_squared_error(actual, pred)) 2.4324199198
RMSE оказывается 2,4324 .
Как интерпретировать RMSE
RMSE — это полезный способ увидеть, насколько хорошо модель соответствует набору данных. Чем больше RMSE, тем больше разница между прогнозируемыми и наблюдаемыми значениями, а это означает, что модель хуже соответствует данным. И наоборот, чем меньше RMSE, тем лучше модель соответствует данным.
Может быть особенно полезно сравнить RMSE двух разных моделей, чтобы увидеть, какая модель лучше всего соответствует данным.
Дополнительные ресурсы
Калькулятор RMSE
Как рассчитать среднеквадратическую ошибку (MSE) в Python
Как рассчитать MAPE в Python