Ebegümeci nedir? cp mi? (tanım ve örnek)


Mallows Cp, birkaç farklı model arasından en iyi regresyon modelini seçmek için kullanılan bir metriktir.

Aşağıdaki şekilde hesaplanır:

Cp = RSS p /S 2 – N + 2(P+1)

Altın:

  • RSS p : p tahmin değişkenine sahip bir model için kalan kareler toplamı
  • S 2 : Modelin artık ortalama karesi (MSE tarafından tahmin edilmiştir)
  • N: Örneklem büyüklüğü
  • P: Tahmin değişkenlerinin sayısı

Mallows Cp, bir regresyon modelinde kullanmak istediğimiz birkaç potansiyel öngörücü değişkenimiz olduğunda ve bu yordayıcı değişkenlerin bir alt kümesini kullanan en iyi modeli belirlemek istediğimizde kullanılır.

P+1’den küçük en düşük Cp değerine sahip modeli tanımlayarak “en iyi” regresyon modelini belirleyebiliriz; burada P, modeldeki yordayıcı değişkenlerin sayısıdır.

Aşağıdaki örnek, çeşitli potansiyel modellerden en iyi regresyon modelini seçmek için Mallows’ Cp’nin nasıl kullanılacağını gösterir.

Örnek: En iyi modeli seçmek için Mallows Cp’yi kullanma

Bir profesörün, bir öğrencinin final sınavında alacağı notu tahmin etmek için bir regresyon modelinde tahmin değişkenleri olarak çalışılan saatleri, girilen hazırlık sınavlarını ve mevcut kümülatif not ortalamasını kullanmak istediğini varsayar.

Yedi farklı regresyon modeline uyar ve her model için Mallows Cp değerini hesaplar:

En iyi regresyon modelini seçmek için Mallows Cp'yi kullanma

Mallows’ Cp değeri model katsayılarının sayısından (P+1) küçükse modelin tarafsız olduğu söylenir.

İki tarafsız modelin olduğunu görebiliriz:

  • Saat ve GPA’nın yordayıcı değişkenler olduğu model (Mallows’ Cp = 2,9, P+1 = 3)
  • Hazırlık Sınavları ve Genel Not Ortalamasının yordayıcı değişken olduğu model (Mallows’ Cp = 2,7, P+1 = 3)

Bu iki modelden hazırlık sınavları ve genel not ortalamasını yordayıcı değişken olarak kullanan model, Mallows’ Cp açısından en düşük değere sahiptir, bu da bize en az yanlılıkla sonuçlanan daha iyi model olduğunu söyler.

Cp des mauves üzerine notlar

Mallows Cp hakkında akılda tutulması gereken bazı şeyler şunlardır:

  • Mallows Cp değeri P+1’e yakın olan modellerin düşük sapmaya sahip olduğu söylenir.
  • Her potansiyel modelin Mallows Cp değeri yüksekse bu, bazı önemli yordayıcı değişkenlerin muhtemelen her modelde eksik olduğunu gösterir.
  • Birkaç potansiyel modelin Mallow’s Cp değeri düşükse, kullanılacak en iyi model olarak en düşük değere sahip modeli seçin.

Ayrıca Mallows’ Cp’nin bir regresyon modelinin uyum iyiliğini ölçmenin yalnızca bir yolu olduğunu unutmayın.

Yaygın olarak kullanılan bir diğer ölçü, kullanılan yordayıcı değişkenlerin sayısına göre ayarlanan, modeldeki yordayıcı değişkenler tarafından açıklanabilen yanıt değişkenindeki varyansın oranını bize söyleyen düzeltilmiş R-karedir.

Birkaç farklı modelden oluşan listeden hangi regresyon modelinin en iyi olduğuna karar vermek için hem Mallows Cp’ye hem de düzeltilmiş R-kare’ye bakmak iyi bir fikirdir.

Ek kaynaklar

R’de Mallows Cp nasıl hesaplanır
R’de düzeltilmiş R-kare nasıl hesaplanır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir