Как рассчитать среднюю абсолютную ошибку в r
В статистике средняя абсолютная ошибка (MAE) — это способ измерения точности данной модели. Он рассчитывается следующим образом:
MAE = (1/n) * Σ|y i – x i |
Золото:
- Σ: греческий символ, означающий «сумма».
- y i : наблюдаемое значение для i-го наблюдения.
- x i : прогнозируемое значение для i-го наблюдения
- n: Общее количество наблюдений
Мы можем вычислить среднюю абсолютную ошибку в R, используя функцию mae (фактическая, прогнозируемая) из пакета Metrics .
В этом руководстве представлены два примера использования этой функции на практике.
Пример 1. Вычисление средней абсолютной ошибки между двумя векторами.
Следующий код показывает, как вычислить среднюю абсолютную ошибку между вектором наблюдаемых значений и вектором прогнозируемых значений:
library (Metrics) #define observed and predicted values observed <- c(12, 13, 14, 15, 15, 22, 27, 29, 29, 30, 32) predicted <- c(11, 13, 14, 14, 16, 19, 24, 30, 32, 36, 30) #calculate mean absolute error between vectors mae(observed, predicted) [1] 1.909091
Средняя абсолютная ошибка (MAE) оказывается равной 1,909 .
Это говорит нам о том, что средняя абсолютная разница между наблюдаемыми значениями и прогнозируемыми значениями составляет 1,909.
Пример 2. Вычисление средней абсолютной ошибки для модели регрессии
Следующий код показывает, как подогнать модель регрессии в R, а затем вычислить среднюю абсолютную ошибку между прогнозами, сделанными моделью, и фактическими наблюдаемыми значениями ответа:
library (Metrics) #create data df <- data. frame (x1=c(1, 3, 3, 4, 4, 6, 6, 8, 9, 3), x2=c(7, 7, 4, 10, 13, 12, 17, 19, 20, 34), y=c(17, 18, 19, 20, 24, 28, 25, 29, 30, 32)) #view first six rows of data head(df) x1 x2 y 1 1 7 17 2 3 7 18 3 3 4 19 4 4 10 20 5 4 13 24 6 6 12 28 #fit regression model model <- lm(y~x1+x2, data=df) #calculate MAE between predicted values and observed values mae(df$y, predict(model)) [1] 1.238241
Средняя абсолютная ошибка (MAE) оказывается равной 1,238 .
Это говорит нам о том, что средняя абсолютная разница между наблюдаемыми значениями и прогнозируемыми значениями составляет 1,238.
В общем, чем ниже значение MAE, тем лучше модель соответствует набору данных. Когда мы сравниваем две разные модели, мы можем сравнить MAE каждой модели, чтобы выяснить, какая из них лучше всего соответствует набору данных.
Дополнительные ресурсы
Калькулятор средней абсолютной ошибки
Как рассчитать среднюю абсолютную ошибку в Excel
Как рассчитать среднюю абсолютную ошибку в Python