Как рассчитать среднеквадратическую ошибку (mse) в python
Среднеквадратическая ошибка (MSE) — это распространенный способ измерения точности прогнозирования модели. Он рассчитывается следующим образом:
MSE = (1/n) * Σ(факт – прогноз) 2
Золото:
- Σ – причудливый символ, означающий «сумма».
- n – размер выборки
- реальный – фактическое значение данных
- прогноз – значение прогнозируемых данных
Чем ниже значение MSE, тем точнее модель способна прогнозировать значения.
Как рассчитать MSE в Python
Мы можем создать простую функцию для расчета MSE в Python:
import numpy as np def mse(actual, pred): actual, pred = np.array(actual), np.array(pred) return np.square(np.subtract(actual,pred)).mean()
Затем мы можем использовать эту функцию для расчета MSE для двух таблиц: одна содержит фактические значения данных, а другая — прогнозируемые значения данных.
actual = [12, 13, 14, 15, 15, 22, 27] pred = [11, 13, 14, 14, 15, 16, 18] mse(actual, pred) 17.0
Среднеквадратическая ошибка (MSE) этой модели оказывается равной 17,0 .
На практике для оценки точности модели чаще используется среднеквадратическая ошибка (RMSE) . Как следует из названия, это просто квадратный корень из среднеквадратической ошибки.
Мы можем определить аналогичную функцию для расчета RMSE:
import numpy as np def rmse(actual, pred): actual, pred = np.array(actual), np.array(pred) return np.sqrt(np.square(np.subtract(actual,pred)).mean())
Затем мы можем использовать эту функцию для расчета RMSE для двух таблиц: одна, которая содержит фактические значения данных, и другая, которая содержит прогнозируемые значения данных.
actual = [12, 13, 14, 15, 15, 22, 27] pred = [11, 13, 14, 14, 15, 16, 18] rmse(actual, pred) 4.1231
Среднеквадратическая ошибка (RMSE) этой модели оказывается 4,1231 .
Дополнительные ресурсы
Калькулятор среднеквадратической ошибки (MSE)
Как рассчитать среднеквадратическую ошибку (MSE) в Excel