Jak obliczyć średni błąd bezwzględny w r


W statystyce średni błąd bezwzględny (MAE) jest sposobem pomiaru dokładności danego modelu. Oblicza się go w następujący sposób:

MAE = (1/n) * Σ|y i – x i |

Złoto:

  • Σ: grecki symbol oznaczający „sumę”
  • y i : Obserwowana wartość i-tej obserwacji
  • x i : przewidywana wartość i-tej obserwacji
  • n: Całkowita liczba obserwacji

Możemy obliczyć średni błąd bezwzględny w R za pomocą funkcji mae (rzeczywista, przewidywana) z pakietu Metrics .

W tym samouczku przedstawiono dwa przykłady wykorzystania tej funkcji w praktyce.

Przykład 1: Oblicz średni błąd bezwzględny między dwoma wektorami

Poniższy kod pokazuje, jak obliczyć średni błąd bezwzględny między wektorem wartości obserwowanych a wektorem wartości przewidywanych:

 library (Metrics)

#define observed and predicted values
observed <- c(12, 13, 14, 15, 15, 22, 27, 29, 29, 30, 32)
predicted <- c(11, 13, 14, 14, 16, 19, 24, 30, 32, 36, 30)

#calculate mean absolute error between vectors
mae(observed, predicted)

[1] 1.909091

Średni błąd bezwzględny (MAE) wynosi 1,909 .

Mówi nam to, że średnia bezwzględna różnica między wartościami obserwowanymi a wartościami przewidywanymi wynosi 1,909.

Przykład 2: Oblicz średni błąd bezwzględny dla modelu regresji

Poniższy kod pokazuje, jak dopasować model regresji w R, a następnie obliczyć średni błąd bezwzględny między przewidywaniami dokonanymi przez model a faktycznie zaobserwowanymi wartościami odpowiedzi:

 library (Metrics)

#create data
df <- data. frame (x1=c(1, 3, 3, 4, 4, 6, 6, 8, 9, 3),
                 x2=c(7, 7, 4, 10, 13, 12, 17, 19, 20, 34),
                 y=c(17, 18, 19, 20, 24, 28, 25, 29, 30, 32))

#view first six rows of data
head(df)

  x1 x2 y
1 1 7 17
2 3 7 18
3 3 4 19
4 4 10 20
5 4 13 24
6 6 12 28

#fit regression model
model <- lm(y~x1+x2, data=df)

#calculate MAE between predicted values and observed values
mae(df$y, predict(model))

[1] 1.238241

Średni błąd bezwzględny (MAE) wynosi 1,238 .

Mówi nam to, że średnia bezwzględna różnica między wartościami obserwowanymi a wartościami przewidywanymi wynosi 1,238.

Ogólnie rzecz biorąc, im niższa wartość MAE, tym lepiej model jest w stanie dopasować zbiór danych. Porównując dwa różne modele, możemy porównać MAE każdego modelu, aby dowiedzieć się, który z nich najlepiej pasuje do zbioru danych.

Dodatkowe zasoby

Kalkulator średniego błędu bezwzględnego
Jak obliczyć średni błąd bezwzględny w programie Excel
Jak obliczyć średni błąd bezwzględny w Pythonie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *