Log-olabilirlik değerleri nasıl yorumlanır (örneklerle)

İle Dr.benjamin anderson Temmuz 23, 2023 Rehber 0 Yorum

Bir regresyon modelinin log olabilirlik değeri, bir modelin uyum iyiliğini ölçmenin bir yoludur. Log-olabilirlik değeri ne kadar yüksek olursa, model bir veri kümesine o kadar iyi uyum sağlar.

Belirli bir model için log olasılığının değeri, negatif sonsuzdan pozitif sonsuza kadar değişebilir. Belirli bir model için gerçek log olabilirlik değeri genellikle anlamsızdır ancak iki veya daha fazla modelin karşılaştırılmasında faydalıdır .

Uygulamada, çoğu zaman bir veri setine birden fazla regresyon modeli yerleştiririz ve verilere en iyi uyan model olarak en yüksek log-olabilirlik değerine sahip modeli seçeriz.

Aşağıdaki örnek, farklı regresyon modelleri için log-olabilirlik değerlerinin pratikte nasıl yorumlanacağını göstermektedir.

Örnek: Log-olabilirlik değerlerini yorumlama

Belirli bir mahalledeki 20 farklı evin yatak odası sayısını, banyo sayısını ve satış fiyatlarını gösteren aşağıdaki veri setine sahip olduğumuzu varsayalım:

Aşağıdaki iki regresyon modelini uydurmak ve hangisinin verilere en iyi uyumu sağladığını belirlemek istediğimizi varsayalım:

Model 1 : Fiyat = β ₀ + β ₁ (oda sayısı)

Model 2 : Fiyat = β ₀ + β ₁ (banyo sayısı)

Aşağıdaki kod, her regresyon modelinin nasıl sığdırılacağını ve R’deki her modelin log-olabilirlik değerinin nasıl hesaplanacağını gösterir:

 #define data
df <- data. frame (beds=c(1, 1, 1, 2, 2, 2, 2, 3, 3, 3,
                        3, 3, 3, 3, 4, 4, 4, 5, 5, 6),
                 baths=c(2, 1, 4, 3, 2, 2, 3, 5, 4, 3,
                         4, 4, 3, 4, 2, 4, 3, 5, 6, 7),
                 price=c(120, 133, 139, 185, 148, 160, 192, 205, 244, 213,
                         236, 280, 275, 273, 312, 311, 304, 415, 396, 488))

#fitmodels
model1 <- lm(price~beds, data=df)
model2 <- lm(price~baths, data=df)

#calculate log-likelihood value of each model
logLik(model1)

'log Lik.' -91.04219 (df=3)

logLik(model2)

'log Lik.' -111.7511 (df=3)

İlk model, ikinci modelden ( -111,75 ) daha yüksek bir log olabilirlik değerine ( -91,04 ) sahiptir; bu, birinci modelin verilere daha iyi uyum sağladığı anlamına gelir.

Günlük olasılık değerlerini kullanmaya ilişkin önlemler

Log olabilirlik değerlerini hesaplarken, bir modele ek öngörücü değişkenler eklemenin, ek yordayıcı değişkenler istatistiksel olarak anlamlı olmasa bile hemen hemen her zaman log olabilirlik değerini artıracağını unutmamak önemlidir.

Bu, yalnızca her modelin aynı sayıda öngörücü değişkene sahip olması durumunda iki regresyon modeli arasındaki log olabilirlik değerlerini karşılaştırmanız gerektiği anlamına gelir.

Farklı sayıda öngörücü değişkene sahip modelleri karşılaştırmak için, iki iç içe regresyon modelinin uyum iyiliğini karşılaştırmak amacıyla bir olabilirlik oranı testi gerçekleştirebilirsiniz.

Ek kaynaklar

R’de doğrusal modelleri sığdırmak için lm() işlevi nasıl kullanılır?
R’de olabilirlik oranı testi nasıl yapılır

yazar hakkında

Dr.benjamin anderson

Merhaba, ben Benjamin, emekli bir istatistik profesörü ve Statorials öğretmenine dönüştüm. İstatistik alanındaki kapsamlı deneyimim ve uzmanlığımla, öğrencilerimi Statorials aracılığıyla güçlendirmek için bilgilerimi paylaşmaya can atıyorum. Daha fazlasını bil

Örnek: Log-olabilirlik değerlerini yorumlama

Günlük olasılık değerlerini kullanmaya ilişkin önlemler

Ek kaynaklar

yazar hakkında

Dr.benjamin anderson

Yorum ekle