R'de ortalama mutlak hata nasıl hesaplanır


İstatistiklerde ortalama mutlak hata (MAE), belirli bir modelin doğruluğunu ölçmenin bir yoludur. Aşağıdaki şekilde hesaplanır:

MAE = (1/n) * Σ|y i – x i |

Altın:

  • Σ: “toplam” anlamına gelen Yunanca bir sembol
  • y i : i’inci gözlem için gözlemlenen değer
  • x i : i’inci gözlem için tahmin edilen değer
  • n: Toplam gözlem sayısı

Metrics paketindeki mae (gerçek, tahmin edilen) fonksiyonunu kullanarak R’deki ortalama mutlak hatayı hesaplayabiliriz.

Bu eğitimde bu özelliğin pratikte nasıl kullanılacağına dair iki örnek verilmektedir.

Örnek 1: İki vektör arasındaki ortalama mutlak hatayı hesaplayın

Aşağıdaki kod, gözlemlenen değerlerin bir vektörü ile tahmin edilen değerlerin bir vektörü arasındaki ortalama mutlak hatanın nasıl hesaplanacağını gösterir:

 library (Metrics)

#define observed and predicted values
observed <- c(12, 13, 14, 15, 15, 22, 27, 29, 29, 30, 32)
predicted <- c(11, 13, 14, 14, 16, 19, 24, 30, 32, 36, 30)

#calculate mean absolute error between vectors
mae(observed, predicted)

[1] 1.909091

Ortalama mutlak hatanın (MAE) 1,909 olduğu ortaya çıkıyor.

Bu bize gözlemlenen değerler ile tahmin edilen değerler arasındaki ortalama mutlak farkın 1,909 olduğunu söylüyor.

Örnek 2: Bir Regresyon Modeli için Ortalama Mutlak Hatanın Hesaplanması

Aşağıdaki kod, R’ye bir regresyon modelinin nasıl sığdırılacağını ve ardından model tarafından yapılan tahminler ile gözlemlenen gerçek yanıt değerleri arasındaki ortalama mutlak hatanın nasıl hesaplanacağını gösterir:

 library (Metrics)

#create data
df <- data. frame (x1=c(1, 3, 3, 4, 4, 6, 6, 8, 9, 3),
                 x2=c(7, 7, 4, 10, 13, 12, 17, 19, 20, 34),
                 y=c(17, 18, 19, 20, 24, 28, 25, 29, 30, 32))

#view first six rows of data
head(df)

  x1 x2 y
1 1 7 17
2 3 7 18
3 3 4 19
4 4 10 20
5 4 13 24
6 6 12 28

#fit regression model
model <- lm(y~x1+x2, data=df)

#calculate MAE between predicted values and observed values
mae(df$y, predict(model))

[1] 1.238241

Ortalama mutlak hatanın (MAE) 1,238 olduğu ortaya çıkıyor.

Bu bize gözlemlenen değerler ile tahmin edilen değerler arasındaki ortalama mutlak farkın 1,238 olduğunu söylüyor.

Genel olarak MAE değeri ne kadar düşük olursa, model bir veri setine o kadar iyi uyum sağlayabilir. İki farklı modeli karşılaştırdığımızda, hangisinin veri setine en iyi uyumu sağladığını bulmak için her modelin MAE’sini karşılaştırabiliriz.

Ek kaynaklar

Ortalama Mutlak Hata Hesaplayıcı
Excel’de Ortalama Mutlak Hata Nasıl Hesaplanır
Python’da Ortalama Mutlak Hata Nasıl Hesaplanır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir