Как рассчитать среднюю абсолютную ошибку в r


В статистике средняя абсолютная ошибка (MAE) — это способ измерения точности данной модели. Он рассчитывается следующим образом:

MAE = (1/n) * Σ|y i – x i |

Золото:

  • Σ: греческий символ, означающий «сумма».
  • y i : наблюдаемое значение для i-го наблюдения.
  • x i : прогнозируемое значение для i-го наблюдения
  • n: Общее количество наблюдений

Мы можем вычислить среднюю абсолютную ошибку в R, используя функцию mae (фактическая, прогнозируемая) из пакета Metrics .

В этом руководстве представлены два примера использования этой функции на практике.

Пример 1. Вычисление средней абсолютной ошибки между двумя векторами.

Следующий код показывает, как вычислить среднюю абсолютную ошибку между вектором наблюдаемых значений и вектором прогнозируемых значений:

 library (Metrics)

#define observed and predicted values
observed <- c(12, 13, 14, 15, 15, 22, 27, 29, 29, 30, 32)
predicted <- c(11, 13, 14, 14, 16, 19, 24, 30, 32, 36, 30)

#calculate mean absolute error between vectors
mae(observed, predicted)

[1] 1.909091

Средняя абсолютная ошибка (MAE) оказывается равной 1,909 .

Это говорит нам о том, что средняя абсолютная разница между наблюдаемыми значениями и прогнозируемыми значениями составляет 1,909.

Пример 2. Вычисление средней абсолютной ошибки для модели регрессии

Следующий код показывает, как подогнать модель регрессии в R, а затем вычислить среднюю абсолютную ошибку между прогнозами, сделанными моделью, и фактическими наблюдаемыми значениями ответа:

 library (Metrics)

#create data
df <- data. frame (x1=c(1, 3, 3, 4, 4, 6, 6, 8, 9, 3),
                 x2=c(7, 7, 4, 10, 13, 12, 17, 19, 20, 34),
                 y=c(17, 18, 19, 20, 24, 28, 25, 29, 30, 32))

#view first six rows of data
head(df)

  x1 x2 y
1 1 7 17
2 3 7 18
3 3 4 19
4 4 10 20
5 4 13 24
6 6 12 28

#fit regression model
model <- lm(y~x1+x2, data=df)

#calculate MAE between predicted values and observed values
mae(df$y, predict(model))

[1] 1.238241

Средняя абсолютная ошибка (MAE) оказывается равной 1,238 .

Это говорит нам о том, что средняя абсолютная разница между наблюдаемыми значениями и прогнозируемыми значениями составляет 1,238.

В общем, чем ниже значение MAE, тем лучше модель соответствует набору данных. Когда мы сравниваем две разные модели, мы можем сравнить MAE каждой модели, чтобы выяснить, какая из них лучше всего соответствует набору данных.

Дополнительные ресурсы

Калькулятор средней абсолютной ошибки
Как рассчитать среднюю абсолютную ошибку в Excel
Как рассчитать среднюю абсолютную ошибку в Python

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *