R'de ortalama mutlak hata nasıl hesaplanır
İstatistiklerde ortalama mutlak hata (MAE), belirli bir modelin doğruluğunu ölçmenin bir yoludur. Aşağıdaki şekilde hesaplanır:
MAE = (1/n) * Σ|y i – x i |
Altın:
- Σ: “toplam” anlamına gelen Yunanca bir sembol
- y i : i’inci gözlem için gözlemlenen değer
- x i : i’inci gözlem için tahmin edilen değer
- n: Toplam gözlem sayısı
Metrics paketindeki mae (gerçek, tahmin edilen) fonksiyonunu kullanarak R’deki ortalama mutlak hatayı hesaplayabiliriz.
Bu eğitimde bu özelliğin pratikte nasıl kullanılacağına dair iki örnek verilmektedir.
Örnek 1: İki vektör arasındaki ortalama mutlak hatayı hesaplayın
Aşağıdaki kod, gözlemlenen değerlerin bir vektörü ile tahmin edilen değerlerin bir vektörü arasındaki ortalama mutlak hatanın nasıl hesaplanacağını gösterir:
library (Metrics) #define observed and predicted values observed <- c(12, 13, 14, 15, 15, 22, 27, 29, 29, 30, 32) predicted <- c(11, 13, 14, 14, 16, 19, 24, 30, 32, 36, 30) #calculate mean absolute error between vectors mae(observed, predicted) [1] 1.909091
Ortalama mutlak hatanın (MAE) 1,909 olduğu ortaya çıkıyor.
Bu bize gözlemlenen değerler ile tahmin edilen değerler arasındaki ortalama mutlak farkın 1,909 olduğunu söylüyor.
Örnek 2: Bir Regresyon Modeli için Ortalama Mutlak Hatanın Hesaplanması
Aşağıdaki kod, R’ye bir regresyon modelinin nasıl sığdırılacağını ve ardından model tarafından yapılan tahminler ile gözlemlenen gerçek yanıt değerleri arasındaki ortalama mutlak hatanın nasıl hesaplanacağını gösterir:
library (Metrics) #create data df <- data. frame (x1=c(1, 3, 3, 4, 4, 6, 6, 8, 9, 3), x2=c(7, 7, 4, 10, 13, 12, 17, 19, 20, 34), y=c(17, 18, 19, 20, 24, 28, 25, 29, 30, 32)) #view first six rows of data head(df) x1 x2 y 1 1 7 17 2 3 7 18 3 3 4 19 4 4 10 20 5 4 13 24 6 6 12 28 #fit regression model model <- lm(y~x1+x2, data=df) #calculate MAE between predicted values and observed values mae(df$y, predict(model)) [1] 1.238241
Ortalama mutlak hatanın (MAE) 1,238 olduğu ortaya çıkıyor.
Bu bize gözlemlenen değerler ile tahmin edilen değerler arasındaki ortalama mutlak farkın 1,238 olduğunu söylüyor.
Genel olarak MAE değeri ne kadar düşük olursa, model bir veri setine o kadar iyi uyum sağlayabilir. İki farklı modeli karşılaştırdığımızda, hangisinin veri setine en iyi uyumu sağladığını bulmak için her modelin MAE’sini karşılaştırabiliriz.
Ek kaynaklar
Ortalama Mutlak Hata Hesaplayıcı
Excel’de Ortalama Mutlak Hata Nasıl Hesaplanır
Python’da Ortalama Mutlak Hata Nasıl Hesaplanır?