Як обчислити середню абсолютну похибку в r
У статистиці середня абсолютна похибка (MAE) — це спосіб вимірювання точності даної моделі. Він розраховується таким чином:
MAE = (1/n) * Σ|y i – x i |
золото:
- Σ: грецький символ, що означає «сума»
- y i : спостережене значення для i-го спостереження
- x i : прогнозоване значення для i-го спостереження
- n: Загальна кількість спостережень
Ми можемо обчислити середню абсолютну похибку в R за допомогою функції mae (фактична, прогнозована) з пакету Metrics .
Цей підручник містить два приклади використання цієї функції на практиці.
Приклад 1: обчисліть середню абсолютну похибку між двома векторами
Наступний код показує, як обчислити середню абсолютну похибку між вектором спостережуваних значень і вектором прогнозованих значень:
library (Metrics) #define observed and predicted values observed <- c(12, 13, 14, 15, 15, 22, 27, 29, 29, 30, 32) predicted <- c(11, 13, 14, 14, 16, 19, 24, 30, 32, 36, 30) #calculate mean absolute error between vectors mae(observed, predicted) [1] 1.909091
Середня абсолютна похибка (MAE) виявляється 1,909 .
Це говорить нам, що середня абсолютна різниця між спостережуваними значеннями та прогнозованими значеннями становить 1,909.
Приклад 2: обчислення середньої абсолютної похибки для моделі регресії
У наведеному нижче коді показано, як підігнати модель регресії в R, а потім обчислити середню абсолютну похибку між прогнозами, зробленими моделлю, і фактичними спостережуваними значеннями відповіді:
library (Metrics) #create data df <- data. frame (x1=c(1, 3, 3, 4, 4, 6, 6, 8, 9, 3), x2=c(7, 7, 4, 10, 13, 12, 17, 19, 20, 34), y=c(17, 18, 19, 20, 24, 28, 25, 29, 30, 32)) #view first six rows of data head(df) x1 x2 y 1 1 7 17 2 3 7 18 3 3 4 19 4 4 10 20 5 4 13 24 6 6 12 28 #fit regression model model <- lm(y~x1+x2, data=df) #calculate MAE between predicted values and observed values mae(df$y, predict(model)) [1] 1.238241
Середня абсолютна похибка (MAE) виявляється 1,238 .
Це говорить нам, що середня абсолютна різниця між спостережуваними значеннями та прогнозованими значеннями становить 1,238.
Загалом, що нижче значення MAE, то краще модель відповідає набору даних. Коли ми порівнюємо дві різні моделі, ми можемо порівняти MAE кожної моделі, щоб дізнатися, яка з них найкраще відповідає набору даних.
Додаткові ресурси
Калькулятор середньої абсолютної похибки
Як обчислити середню абсолютну похибку в Excel
Як обчислити середню абсолютну похибку в Python