Hoe de gemiddelde absolute fout in r te berekenen
In de statistiek is de gemiddelde absolute fout (MAE) een manier om de nauwkeurigheid van een bepaald model te meten. Het wordt als volgt berekend:
MAE = (1/n) * Σ|y i – x i |
Goud:
- Σ: een Grieks symbool dat ‘som’ betekent
- y i : De waargenomen waarde voor de i-de waarneming
- x i : de voorspelde waarde voor de i-de waarneming
- n: Het totale aantal waarnemingen
We kunnen de gemiddelde absolute fout in R berekenen met behulp van de mae-functie (werkelijk, voorspeld) uit het Metrics- pakket.
Deze tutorial biedt twee voorbeelden van hoe u deze functie in de praktijk kunt gebruiken.
Voorbeeld 1: Bereken de gemiddelde absolute fout tussen twee vectoren
De volgende code laat zien hoe je de gemiddelde absolute fout tussen een vector van waargenomen waarden en een vector van voorspelde waarden kunt berekenen:
library (Metrics) #define observed and predicted values observed <- c(12, 13, 14, 15, 15, 22, 27, 29, 29, 30, 32) predicted <- c(11, 13, 14, 14, 16, 19, 24, 30, 32, 36, 30) #calculate mean absolute error between vectors mae(observed, predicted) [1] 1.909091
De gemiddelde absolute fout (MAE) blijkt 1,909 te zijn.
Dit vertelt ons dat het gemiddelde absolute verschil tussen de waargenomen waarden en de voorspelde waarden 1,909 bedraagt.
Voorbeeld 2: Bereken de gemiddelde absolute fout voor een regressiemodel
De volgende code laat zien hoe u een regressiemodel in R kunt passen en vervolgens de gemiddelde absolute fout kunt berekenen tussen de voorspellingen van het model en de daadwerkelijk waargenomen responswaarden:
library (Metrics) #create data df <- data. frame (x1=c(1, 3, 3, 4, 4, 6, 6, 8, 9, 3), x2=c(7, 7, 4, 10, 13, 12, 17, 19, 20, 34), y=c(17, 18, 19, 20, 24, 28, 25, 29, 30, 32)) #view first six rows of data head(df) x1 x2 y 1 1 7 17 2 3 7 18 3 3 4 19 4 4 10 20 5 4 13 24 6 6 12 28 #fit regression model model <- lm(y~x1+x2, data=df) #calculate MAE between predicted values and observed values mae(df$y, predict(model)) [1] 1.238241
De gemiddelde absolute fout (MAE) blijkt 1,238 te zijn.
Dit vertelt ons dat het gemiddelde absolute verschil tussen de waargenomen waarden en de voorspelde waarden 1,238 bedraagt.
Over het algemeen geldt dat hoe lager de MAE-waarde, hoe beter een model in een dataset past. Wanneer we twee verschillende modellen vergelijken, kunnen we de MAE van elk model vergelijken om erachter te komen welk model het beste bij een dataset past.
Aanvullende bronnen
Gemiddelde absolute foutcalculator
Hoe de gemiddelde absolute fout in Excel te berekenen
Hoe de gemiddelde absolute fout in Python te berekenen