R'de mor 'cp nasıl hesaplanır?


Regresyon analizinde Mallows Cp , çeşitli potansiyel modeller arasından en iyi regresyon modelini seçmek için kullanılan bir ölçümdür.

P +1’e yakın en düşük Cp değerine sahip modeli belirleyerek “en iyi” regresyon modelini belirleyebiliriz; burada p , modeldeki yordayıcı değişkenlerin sayısıdır.

R’deki Mallows’un Cp’sini hesaplamanın en kolay yolu olsrr paketindeki ols_mallows_cp() fonksiyonunu kullanmaktır.

Aşağıdaki örnek, R’deki çeşitli potansiyel modeller arasından en iyi regresyon modelini seçmek amacıyla Mallows’ Cp’yi hesaplamak için bu fonksiyonun nasıl kullanılacağını gösterir.

Örnek: R’de Mallows Cp’nin hesaplanması

Diyelim ki mtcars veri kümesindeki değişkenleri kullanarak üç farklı çoklu doğrusal regresyon modelini sığdırmak istiyoruz.

Aşağıdaki kod, aşağıdaki regresyon modellerinin nasıl sığdırılacağını gösterir:

  • Tam modeldeki tahmin değişkenleri: 10 değişken
  • Model 1’deki tahmin değişkenleri: disp, hp, wt, qsec
  • Model 2’deki tahmin değişkenleri: disp, qsec
  • Model 3’teki tahmin değişkenleri: disp, wt

Aşağıdaki kod, bu regresyon modellerinin her birine nasıl uyulacağını ve her modelin Mallows Cp’sini hesaplamak için ols_mallows_cp() işlevinin nasıl kullanılacağını gösterir:

 library (olsrr)

#fit full model
full_model <- lm(mpg ~ ., data = mtcars)

#fit three smaller models
model1 <- lm(mpg ~ disp + hp + wt + qsec, data = mtcars)
model2 <- lm(mpg ~ disp + qsec, data = mtcars)
model3 <- lm(mpg ~ disp + wt, data = mtcars)

#calculate Mallows' Cp for each model
ols_mallows_cp(model1, full_model)

[1] 4.430434

ols_mallows_cp(model2, full_model)

[1] 18.64082

ols_mallows_cp(model3, full_model)

[1] 9.122225

Sonucun nasıl yorumlanacağı aşağıda açıklanmıştır:

  • Model 1: p + 1 = 5, Ebegümeci Cp = 4,43
  • Model 2: p + 1 = 3, Ebegümeci Cp = 18,64
  • Model 3: p + 1 = 30, Ebegümeci Cp = 9,12

Model 1’in Mallows’ Cp için p + 1’e en yakın değere sahip olduğunu görebiliriz, bu da üç potansiyel model arasında en az yanlılığa yol açan en iyi model olduğunu gösterir.

Cp des mauves üzerine notlar

Mallows Cp hakkında akılda tutulması gereken bazı şeyler şunlardır:

  • Her potansiyel modelin Mallows Cp değeri yüksekse bu, bazı önemli yordayıcı değişkenlerin muhtemelen her modelde eksik olduğunu gösterir.
  • Birkaç potansiyel modelin Mallow’s Cp değeri düşükse, kullanılacak en iyi model olarak en düşük değere sahip modeli seçin.

Mallows’ Cp’nin çeşitli potansiyel modeller arasında “en iyi” regresyon modelini tanımlamanın yalnızca bir yolu olduğunu unutmayın.

Yaygın olarak kullanılan bir diğer ölçü, kullanılan yordayıcı değişkenlerin sayısına göre ayarlanan, modeldeki yordayıcı değişkenler tarafından açıklanabilen yanıt değişkenindeki varyansın oranını bize söyleyen düzeltilmiş R-karedir.

Birkaç farklı modelden oluşan listeden hangi regresyon modelinin en iyi olduğuna karar vermek için hem Mallows’ Cp’ye hem de düzeltilmiş R-kare’ye bakmanız önerilir.

Ek kaynaklar

R’de düzeltilmiş R-kare nasıl hesaplanır
R’de AIC nasıl hesaplanır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir