Log-olabilirlik değerleri nasıl yorumlanır (örneklerle)
Bir regresyon modelinin log olabilirlik değeri, bir modelin uyum iyiliğini ölçmenin bir yoludur. Log-olabilirlik değeri ne kadar yüksek olursa, model bir veri kümesine o kadar iyi uyum sağlar.
Belirli bir model için log olasılığının değeri, negatif sonsuzdan pozitif sonsuza kadar değişebilir. Belirli bir model için gerçek log olabilirlik değeri genellikle anlamsızdır ancak iki veya daha fazla modelin karşılaştırılmasında faydalıdır .
Uygulamada, çoğu zaman bir veri setine birden fazla regresyon modeli yerleştiririz ve verilere en iyi uyan model olarak en yüksek log-olabilirlik değerine sahip modeli seçeriz.
Aşağıdaki örnek, farklı regresyon modelleri için log-olabilirlik değerlerinin pratikte nasıl yorumlanacağını göstermektedir.
Örnek: Log-olabilirlik değerlerini yorumlama
Belirli bir mahalledeki 20 farklı evin yatak odası sayısını, banyo sayısını ve satış fiyatlarını gösteren aşağıdaki veri setine sahip olduğumuzu varsayalım:
Aşağıdaki iki regresyon modelini uydurmak ve hangisinin verilere en iyi uyumu sağladığını belirlemek istediğimizi varsayalım:
Model 1 : Fiyat = β 0 + β 1 (oda sayısı)
Model 2 : Fiyat = β 0 + β 1 (banyo sayısı)
Aşağıdaki kod, her regresyon modelinin nasıl sığdırılacağını ve R’deki her modelin log-olabilirlik değerinin nasıl hesaplanacağını gösterir:
#define data df <- data. frame (beds=c(1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 6), baths=c(2, 1, 4, 3, 2, 2, 3, 5, 4, 3, 4, 4, 3, 4, 2, 4, 3, 5, 6, 7), price=c(120, 133, 139, 185, 148, 160, 192, 205, 244, 213, 236, 280, 275, 273, 312, 311, 304, 415, 396, 488)) #fitmodels model1 <- lm(price~beds, data=df) model2 <- lm(price~baths, data=df) #calculate log-likelihood value of each model logLik(model1) 'log Lik.' -91.04219 (df=3) logLik(model2) 'log Lik.' -111.7511 (df=3)
İlk model, ikinci modelden ( -111,75 ) daha yüksek bir log olabilirlik değerine ( -91,04 ) sahiptir; bu, birinci modelin verilere daha iyi uyum sağladığı anlamına gelir.
Günlük olasılık değerlerini kullanmaya ilişkin önlemler
Log olabilirlik değerlerini hesaplarken, bir modele ek öngörücü değişkenler eklemenin, ek yordayıcı değişkenler istatistiksel olarak anlamlı olmasa bile hemen hemen her zaman log olabilirlik değerini artıracağını unutmamak önemlidir.
Bu, yalnızca her modelin aynı sayıda öngörücü değişkene sahip olması durumunda iki regresyon modeli arasındaki log olabilirlik değerlerini karşılaştırmanız gerektiği anlamına gelir.
Farklı sayıda öngörücü değişkene sahip modelleri karşılaştırmak için, iki iç içe regresyon modelinin uyum iyiliğini karşılaştırmak amacıyla bir olabilirlik oranı testi gerçekleştirebilirsiniz.
Ek kaynaklar
R’de doğrusal modelleri sığdırmak için lm() işlevi nasıl kullanılır?
R’de olabilirlik oranı testi nasıl yapılır