Hoe de gemiddelde absolute fout in r te berekenen


In de statistiek is de gemiddelde absolute fout (MAE) een manier om de nauwkeurigheid van een bepaald model te meten. Het wordt als volgt berekend:

MAE = (1/n) * Σ|y i – x i |

Goud:

  • Σ: een Grieks symbool dat ‘som’ betekent
  • y i : De waargenomen waarde voor de i-de waarneming
  • x i : de voorspelde waarde voor de i-de waarneming
  • n: Het totale aantal waarnemingen

We kunnen de gemiddelde absolute fout in R berekenen met behulp van de mae-functie (werkelijk, voorspeld) uit het Metrics- pakket.

Deze tutorial biedt twee voorbeelden van hoe u deze functie in de praktijk kunt gebruiken.

Voorbeeld 1: Bereken de gemiddelde absolute fout tussen twee vectoren

De volgende code laat zien hoe je de gemiddelde absolute fout tussen een vector van waargenomen waarden en een vector van voorspelde waarden kunt berekenen:

 library (Metrics)

#define observed and predicted values
observed <- c(12, 13, 14, 15, 15, 22, 27, 29, 29, 30, 32)
predicted <- c(11, 13, 14, 14, 16, 19, 24, 30, 32, 36, 30)

#calculate mean absolute error between vectors
mae(observed, predicted)

[1] 1.909091

De gemiddelde absolute fout (MAE) blijkt 1,909 te zijn.

Dit vertelt ons dat het gemiddelde absolute verschil tussen de waargenomen waarden en de voorspelde waarden 1,909 bedraagt.

Voorbeeld 2: Bereken de gemiddelde absolute fout voor een regressiemodel

De volgende code laat zien hoe u een regressiemodel in R kunt passen en vervolgens de gemiddelde absolute fout kunt berekenen tussen de voorspellingen van het model en de daadwerkelijk waargenomen responswaarden:

 library (Metrics)

#create data
df <- data. frame (x1=c(1, 3, 3, 4, 4, 6, 6, 8, 9, 3),
                 x2=c(7, 7, 4, 10, 13, 12, 17, 19, 20, 34),
                 y=c(17, 18, 19, 20, 24, 28, 25, 29, 30, 32))

#view first six rows of data
head(df)

  x1 x2 y
1 1 7 17
2 3 7 18
3 3 4 19
4 4 10 20
5 4 13 24
6 6 12 28

#fit regression model
model <- lm(y~x1+x2, data=df)

#calculate MAE between predicted values and observed values
mae(df$y, predict(model))

[1] 1.238241

De gemiddelde absolute fout (MAE) blijkt 1,238 te zijn.

Dit vertelt ons dat het gemiddelde absolute verschil tussen de waargenomen waarden en de voorspelde waarden 1,238 bedraagt.

Over het algemeen geldt dat hoe lager de MAE-waarde, hoe beter een model in een dataset past. Wanneer we twee verschillende modellen vergelijken, kunnen we de MAE van elk model vergelijken om erachter te komen welk model het beste bij een dataset past.

Aanvullende bronnen

Gemiddelde absolute foutcalculator
Hoe de gemiddelde absolute fout in Excel te berekenen
Hoe de gemiddelde absolute fout in Python te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert