R'de aic nasıl hesaplanır (örnekler dahil)


Akaike Bilgi Kriteri (AIC), çoklu regresyon modellerinin uyumunu karşılaştırmak için kullanılan bir ölçümdür.

Aşağıdaki şekilde hesaplanır:

AIC = 2K – 2 ln (L)

Altın:

  • K: Model parametrelerinin sayısı. K’nin varsayılan değeri 2’dir, dolayısıyla yalnızca bir tahmin değişkeni olan bir modelin K değeri 2+1 = 3 olacaktır.
  • ln (L) : Modelin log-olasılığı. Çoğu istatistik yazılımı bu değeri sizin için otomatik olarak hesaplayabilir.

AIC, verilerdeki en fazla varyasyonu açıklayan modeli bulmak ve aşırı sayıda parametre kullanan modelleri cezalandırmak için tasarlanmıştır.

Birden fazla regresyon modelini yerleştirdikten sonra her modelin AIC değerini karşılaştırabilirsiniz. AIC ne kadar düşükse model o kadar uygundur.

R’deki çoklu regresyon modellerinin AIC’sini hesaplamak için AICcmodavg paketindeki aictab() fonksiyonunu kullanabiliriz.

Aşağıdaki örnek, R’deki çeşitli regresyon modelleri için AIC’yi hesaplamak ve yorumlamak amacıyla bu işlevin nasıl kullanılacağını gösterir.

Örnek: R’de AIC’yi hesaplama ve yorumlama

Diyelim ki mtcars veri kümesindeki değişkenleri kullanarak üç farklı çoklu doğrusal regresyon modelini sığdırmak istiyoruz.

Her modelde kullanacağımız tahmin değişkenleri şunlardır:

  • Model 1’deki tahmin değişkenleri: disp, hp, wt, qsec
  • Model 2’deki tahmin değişkenleri: disp, qsec
  • Model 3’teki tahmin değişkenleri: disp, wt

Aşağıdaki kod, bu regresyon modellerinin her birine nasıl uyulacağını gösterir:

 #fit three models
model1 <- lm(mpg ~ disp + hp + wt + qsec, data = mtcars)
model2 <- lm(mpg ~ disp + qsec, data = mtcars)
model3 <- lm(mpg ~ disp + wt, data = mtcars)

Daha sonra modelleri bir listeye koyacağız ve her modelin AIC’sini hesaplamak için aictab() işlevini kullanacağız:

 library (AICcmodavg)

#define list of models
models <- list(model1, model2, model3)

#specify model names
mod.names <- c('disp.hp.wt.qsec', 'disp.qsec', 'disp.wt')

#calculate AIC of each model
aictab(cand.set = models, modnames = mod.names)

Model selection based on AICc:

                K AICc Delta_AICc AICcWt Cum.Wt LL
disp.hp.wt.qsec 6 162.43 0.00 0.83 0.83 -73.53
available wt 4 165.65 3.22 0.17 1.00 -78.08
disp.qsec 4 173.32 10.89 0.00 1.00 -81.92

Sonucun nasıl yorumlanacağı aşağıda açıklanmıştır:

  • K: Modeldeki parametre sayısı.
  • AICc: Modelin AIC değeri. Küçük “c” harfi, AIC’nin küçük numuneler için düzeltilmiş AIC’den hesaplandığını gösterir.
  • Delta_AICc: En iyi modelin AIC’si ile karşılaştırıldığında mevcut modelin AIC’si arasındaki fark.
  • AICcWt: modelde bulunabilecek toplam tahmin gücünün oranı.
  • Cum.Wt : AIC ağırlıklarının kümülatif toplamı.
  • LL: Modelin log-olasılığı. Bu bize, kullandığımız veriler göz önüne alındığında modelin ne kadar muhtemel olduğunu söyler.

En düşük AIC değerine sahip model her zaman ilk sırada listelenir. Sonuçtan aşağıdaki modelin en düşük AIC değerine sahip olduğunu ve dolayısıyla en uygun model olduğunu görebiliriz:

mpg = β 0 + β 1 (disp) + β 2 (hp) + β 3 (ağırlık) + β 4 (qsec)

Bu modeli en iyi olarak belirledikten sonra, model uyumuna geçebilir ve tahmin değişkenleri seti ile yanıt değişkeni arasındaki kesin ilişkiyi belirlemek için R-kare değeri ve beta katsayıları dahil sonuçları analiz edebiliriz.

Ek kaynaklar

R’de basit doğrusal regresyon nasıl gerçekleştirilir
R’de çoklu doğrusal regresyon nasıl gerçekleştirilir
R’de düzeltilmiş R-kare nasıl hesaplanır
R’de Mallows Cp nasıl hesaplanır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir