R'de mor 'cp nasıl hesaplanır?
Regresyon analizinde Mallows Cp , çeşitli potansiyel modeller arasından en iyi regresyon modelini seçmek için kullanılan bir ölçümdür.
P +1’e yakın en düşük Cp değerine sahip modeli belirleyerek “en iyi” regresyon modelini belirleyebiliriz; burada p , modeldeki yordayıcı değişkenlerin sayısıdır.
R’deki Mallows’un Cp’sini hesaplamanın en kolay yolu olsrr paketindeki ols_mallows_cp() fonksiyonunu kullanmaktır.
Aşağıdaki örnek, R’deki çeşitli potansiyel modeller arasından en iyi regresyon modelini seçmek amacıyla Mallows’ Cp’yi hesaplamak için bu fonksiyonun nasıl kullanılacağını gösterir.
Örnek: R’de Mallows Cp’nin hesaplanması
Diyelim ki mtcars veri kümesindeki değişkenleri kullanarak üç farklı çoklu doğrusal regresyon modelini sığdırmak istiyoruz.
Aşağıdaki kod, aşağıdaki regresyon modellerinin nasıl sığdırılacağını gösterir:
- Tam modeldeki tahmin değişkenleri: 10 değişken
- Model 1’deki tahmin değişkenleri: disp, hp, wt, qsec
- Model 2’deki tahmin değişkenleri: disp, qsec
- Model 3’teki tahmin değişkenleri: disp, wt
Aşağıdaki kod, bu regresyon modellerinin her birine nasıl uyulacağını ve her modelin Mallows Cp’sini hesaplamak için ols_mallows_cp() işlevinin nasıl kullanılacağını gösterir:
library (olsrr) #fit full model full_model <- lm(mpg ~ ., data = mtcars) #fit three smaller models model1 <- lm(mpg ~ disp + hp + wt + qsec, data = mtcars) model2 <- lm(mpg ~ disp + qsec, data = mtcars) model3 <- lm(mpg ~ disp + wt, data = mtcars) #calculate Mallows' Cp for each model ols_mallows_cp(model1, full_model) [1] 4.430434 ols_mallows_cp(model2, full_model) [1] 18.64082 ols_mallows_cp(model3, full_model) [1] 9.122225
Sonucun nasıl yorumlanacağı aşağıda açıklanmıştır:
- Model 1: p + 1 = 5, Ebegümeci Cp = 4,43
- Model 2: p + 1 = 3, Ebegümeci Cp = 18,64
- Model 3: p + 1 = 30, Ebegümeci Cp = 9,12
Model 1’in Mallows’ Cp için p + 1’e en yakın değere sahip olduğunu görebiliriz, bu da üç potansiyel model arasında en az yanlılığa yol açan en iyi model olduğunu gösterir.
Cp des mauves üzerine notlar
Mallows Cp hakkında akılda tutulması gereken bazı şeyler şunlardır:
- Her potansiyel modelin Mallows Cp değeri yüksekse bu, bazı önemli yordayıcı değişkenlerin muhtemelen her modelde eksik olduğunu gösterir.
- Birkaç potansiyel modelin Mallow’s Cp değeri düşükse, kullanılacak en iyi model olarak en düşük değere sahip modeli seçin.
Mallows’ Cp’nin çeşitli potansiyel modeller arasında “en iyi” regresyon modelini tanımlamanın yalnızca bir yolu olduğunu unutmayın.
Yaygın olarak kullanılan bir diğer ölçü, kullanılan yordayıcı değişkenlerin sayısına göre ayarlanan, modeldeki yordayıcı değişkenler tarafından açıklanabilen yanıt değişkenindeki varyansın oranını bize söyleyen düzeltilmiş R-karedir.
Birkaç farklı modelden oluşan listeden hangi regresyon modelinin en iyi olduğuna karar vermek için hem Mallows’ Cp’ye hem de düzeltilmiş R-kare’ye bakmanız önerilir.
Ek kaynaklar
R’de düzeltilmiş R-kare nasıl hesaplanır
R’de AIC nasıl hesaplanır