Как рассчитать среднеквадратическую ошибку (mse) в python


Среднеквадратическая ошибка (MSE) — это распространенный способ измерения точности прогнозирования модели. Он рассчитывается следующим образом:

MSE = (1/n) * Σ(факт – прогноз) 2

Золото:

  • Σ – причудливый символ, означающий «сумма».
  • n – размер выборки
  • реальный – фактическое значение данных
  • прогноз – значение прогнозируемых данных

Чем ниже значение MSE, тем точнее модель способна прогнозировать значения.

Как рассчитать MSE в Python

Мы можем создать простую функцию для расчета MSE в Python:

 import numpy as np

def mse(actual, pred): 
    actual, pred = np.array(actual), np.array(pred)
    return np.square(np.subtract(actual,pred)).mean() 

Затем мы можем использовать эту функцию для расчета MSE для двух таблиц: одна содержит фактические значения данных, а другая — прогнозируемые значения данных.

 actual = [12, 13, 14, 15, 15, 22, 27]
pred = [11, 13, 14, 14, 15, 16, 18]

mse(actual, pred)

17.0

Среднеквадратическая ошибка (MSE) этой модели оказывается равной 17,0 .

На практике для оценки точности модели чаще используется среднеквадратическая ошибка (RMSE) . Как следует из названия, это просто квадратный корень из среднеквадратической ошибки.

Мы можем определить аналогичную функцию для расчета RMSE:

 import numpy as np

def rmse(actual, pred): 
    actual, pred = np.array(actual), np.array(pred)
    return np.sqrt(np.square(np.subtract(actual,pred)).mean())

Затем мы можем использовать эту функцию для расчета RMSE для двух таблиц: одна, которая содержит фактические значения данных, и другая, которая содержит прогнозируемые значения данных.

 actual = [12, 13, 14, 15, 15, 22, 27]
pred = [11, 13, 14, 14, 15, 16, 18]

rmse(actual, pred)

4.1231

Среднеквадратическая ошибка (RMSE) этой модели оказывается 4,1231 .

Дополнительные ресурсы

Калькулятор среднеквадратической ошибки (MSE)
Как рассчитать среднеквадратическую ошибку (MSE) в Excel

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *