Як обчислити середню абсолютну похибку в r


У статистиці середня абсолютна похибка (MAE) — це спосіб вимірювання точності даної моделі. Він розраховується таким чином:

MAE = (1/n) * Σ|y i – x i |

золото:

  • Σ: грецький символ, що означає «сума»
  • y i : спостережене значення для i-го спостереження
  • x i : прогнозоване значення для i-го спостереження
  • n: Загальна кількість спостережень

Ми можемо обчислити середню абсолютну похибку в R за допомогою функції mae (фактична, прогнозована) з пакету Metrics .

Цей підручник містить два приклади використання цієї функції на практиці.

Приклад 1: обчисліть середню абсолютну похибку між двома векторами

Наступний код показує, як обчислити середню абсолютну похибку між вектором спостережуваних значень і вектором прогнозованих значень:

 library (Metrics)

#define observed and predicted values
observed <- c(12, 13, 14, 15, 15, 22, 27, 29, 29, 30, 32)
predicted <- c(11, 13, 14, 14, 16, 19, 24, 30, 32, 36, 30)

#calculate mean absolute error between vectors
mae(observed, predicted)

[1] 1.909091

Середня абсолютна похибка (MAE) виявляється 1,909 .

Це говорить нам, що середня абсолютна різниця між спостережуваними значеннями та прогнозованими значеннями становить 1,909.

Приклад 2: обчислення середньої абсолютної похибки для моделі регресії

У наведеному нижче коді показано, як підігнати модель регресії в R, а потім обчислити середню абсолютну похибку між прогнозами, зробленими моделлю, і фактичними спостережуваними значеннями відповіді:

 library (Metrics)

#create data
df <- data. frame (x1=c(1, 3, 3, 4, 4, 6, 6, 8, 9, 3),
                 x2=c(7, 7, 4, 10, 13, 12, 17, 19, 20, 34),
                 y=c(17, 18, 19, 20, 24, 28, 25, 29, 30, 32))

#view first six rows of data
head(df)

  x1 x2 y
1 1 7 17
2 3 7 18
3 3 4 19
4 4 10 20
5 4 13 24
6 6 12 28

#fit regression model
model <- lm(y~x1+x2, data=df)

#calculate MAE between predicted values and observed values
mae(df$y, predict(model))

[1] 1.238241

Середня абсолютна похибка (MAE) виявляється 1,238 .

Це говорить нам, що середня абсолютна різниця між спостережуваними значеннями та прогнозованими значеннями становить 1,238.

Загалом, що нижче значення MAE, то краще модель відповідає набору даних. Коли ми порівнюємо дві різні моделі, ми можемо порівняти MAE кожної моделі, щоб дізнатися, яка з них найкраще відповідає набору даних.

Додаткові ресурси

Калькулятор середньої абсолютної похибки
Як обчислити середню абсолютну похибку в Excel
Як обчислити середню абсолютну похибку в Python

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *