Sas'ta varyans enflasyon faktörü (vif) nasıl hesaplanır?


Regresyon analizinde, çoklu doğrusallık , iki veya daha fazla yordayıcı değişkenin regresyon modelinde benzersiz veya bağımsız bilgi sağlamayacak şekilde birbiriyle yüksek düzeyde korelasyona sahip olması durumunda ortaya çıkar.

Değişkenler arasındaki korelasyon derecesi yeterince yüksekse, bu durum regresyon modelinin yerleştirilmesinde ve yorumlanmasında sorunlara neden olabilir.

Çoklu doğrusallığı tespit etmenin bir yolu, bir regresyon modelinde açıklayıcı değişkenler arasındaki korelasyonu ve korelasyonun gücünü ölçen, varyans enflasyon faktörü (VIF) olarak bilinen bir ölçüm kullanmaktır.

Bu eğitimde SAS’ta VIF’nin nasıl hesaplanacağı açıklanmaktadır.

Örnek: SAS’ta VIF’nin hesaplanması

Bu örnek için 10 basketbolcunun özelliklerini açıklayan bir veri seti oluşturacağız:

 /*create dataset*/
data my_data;
    input rating points assists rebounds;
    datalines ;
90 25 5 11
85 20 7 8
82 14 7 10
88 16 8 6
94 27 5 6
90 20 7 9
76 12 6 6
75 15 9 10
87 14 9 10
86 19 5 7
;
run ;

/*view dataset*/
proc print data =my_data; 

Yanıt değişkeni olarak skoru ve tahmin değişkenleri olarak sayı , asist ve ribaundları kullanarak çoklu doğrusal regresyon modelini uydurmak istediğimizi varsayalım.

Modeldeki her öngörücü değişken için VIF değerlerini hesaplamak amacıyla bu regresyon modelini VIF seçeneğiyle eşleştirmek için PROC REG’i kullanabiliriz:

 /*fit regression model and calculate VIF values*/
proc reg data =my_data;
    model rating = points assists rebounds / lively ;
run ; 

SAS'ta VIF

Parametre Tahminleri tablosundan her bir yordayıcı değişkenin VIF değerlerini görebiliriz:

  • puan: 1,76398
  • asist: 1.96591
  • ribaund: 1.17503

Not: Bu değer alakalı olmadığından şablondaki “Kesişme” için VIF’yi göz ardı edin.

VIF değeri 1’den başlar ve üst sınırı yoktur. VIF’leri yorumlamanın genel kuralı şudur:

  • 1 değeri, belirli bir yordayıcı değişken ile modeldeki diğer yordayıcı değişkenler arasında bir korelasyon olmadığını gösterir.
  • 1 ile 5 arasındaki bir değer, belirli bir yordayıcı değişken ile modeldeki diğer yordayıcı değişkenler arasında orta düzeyde bir korelasyon olduğunu gösterir, ancak bu genellikle özel dikkat gerektirecek kadar ciddi değildir.
  • 5’ten büyük bir değer, belirli bir yordayıcı değişken ile modeldeki diğer yordayıcı değişkenler arasında potansiyel olarak ciddi bir korelasyon olduğunu gösterir. Bu durumda regresyon sonuçlarındaki katsayı tahminleri ve p değerleri muhtemelen güvenilmez olacaktır.

Regresyon modelimizde yordayıcı değişkenlerin VIF değerlerinin her biri 1’e yakın olduğundan örneğimizde çoklu doğrusallık söz konusu değildir.

Çoklu bağlantı sorunuyla nasıl baş edilir

Çoklu bağlantının regresyon modelinizde bir sorun olduğunu belirlerseniz, bunu çözmenin birkaç yaygın yolu vardır:

1. Yüksek derecede ilişkili değişkenlerden bir veya daha fazlasını kaldırın.

Bu çoğu durumda en hızlı çözümdür ve genellikle kabul edilebilir bir çözümdür çünkü kaldırdığınız değişkenler zaten gereksizdir ve modele çok az benzersiz veya bağımsız bilgi katar.

2. Yordayıcı değişkenleri bir şekilde toplama veya çıkarma gibi doğrusal bir şekilde birleştirir.

Bunu yaparak, her iki değişkenden gelen bilgileri kapsayan yeni bir değişken oluşturabilir ve artık çoklu bağlantı sorunu yaşamazsınız.

3. Temel bileşen analizi veya kısmi en küçük kareler (PLS) regresyonu gibi yüksek korelasyonlu değişkenleri hesaba katacak şekilde tasarlanmış bir analiz gerçekleştirin.

Bu teknikler özellikle yüksek derecede ilişkili öngörücü değişkenleri ele almak için tasarlanmıştır.

Ek kaynaklar

Aşağıdaki eğitimlerde SAS’ta diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

SAS’ta çoklu doğrusal regresyon nasıl gerçekleştirilir?
SAS’ta Artık Grafik Nasıl Oluşturulur
SAS’ta pişirme mesafesi nasıl hesaplanır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir