Sas'ta korelasyon nasıl hesaplanır (örneklerle)
İki değişken arasındaki ilişkiyi ölçmenin bir yolu, iki değişken arasındaki doğrusal ilişkiyi ölçen Pearson korelasyon katsayısını kullanmaktır .
Her zaman -1 ile 1 arasında bir değer alır; burada:
- -1, iki değişken arasında tamamen negatif bir doğrusal korelasyonu gösterir
- 0, iki değişken arasında doğrusal bir korelasyon olmadığını gösterir
- 1, iki değişken arasında mükemmel pozitif doğrusal bir korelasyonu gösterir
Korelasyon katsayısı sıfırdan ne kadar uzaksa, iki değişken arasındaki ilişki o kadar güçlüdür.
Aşağıdaki örnekler, Finlandiya’daki bir gölde yakalanan 159 farklı balık için çeşitli ölçümler içeren Fish adlı SAS entegre veri kümesindeki değişkenler arasındaki korelasyon katsayısını hesaplamak için SAS’ta proc corr’un nasıl kullanılacağını gösterir.
Bu veri kümesinin ilk 10 gözlemini görüntülemek için proc print’i kullanabiliriz:
/*view first 10 observations from Fish dataset*/ proc print data =sashelp.Fish( obs = 10 ); run ;
Örnek 1: İki değişken arasındaki korelasyon
Yükseklik ve Genişlik değişkenleri arasındaki Pearson korelasyon katsayısını hesaplamak için aşağıdaki kodu kullanabiliriz:
/*calculate correlation coefficient between Height and Width*/ proc corr data =sashelp.fish; var HeightWidth; run ;
İlk tablo yükseklik ve genişliğe ilişkin özet istatistikleri görüntüler.
İkinci tablo, korelasyonun istatistiksel olarak anlamlı olup olmadığını bize söyleyen bir p değeri de dahil olmak üzere, iki değişken arasındaki Pearson korelasyon katsayısını gösterir.
Sonuçtan şunları görebiliriz:
- Pearson korelasyon katsayısı: 0,79288
- P değeri: <0,0001
Bu bize yükseklik ve genişlik arasında güçlü bir pozitif korelasyon olduğunu ve p değeri α = 0,05’ten küçük olduğundan korelasyonun istatistiksel olarak anlamlı olduğunu söyler.
İlgili: Ne “güçlü” bir korelasyon olarak kabul edilir?
Örnek 2: Tüm değişkenler arasındaki korelasyon
Veri kümesindeki değişkenlerin tüm ikili kombinasyonları arasındaki Pearson korelasyon katsayısını hesaplamak için aşağıdaki kodu kullanabiliriz:
/*calculate correlation coefficient between all pairwise combinations of variables*/ proc corr data =sashelp.fish; run;
Sonuç, veri kümesindeki sayısal değişkenlerin her ikili kombinasyonu için Pearson korelasyon katsayısını ve karşılık gelen p değerlerini içeren birkorelasyon matrisini görüntüler.
Örneğin:
- Ağırlık ve uzunluk1 arasındaki Pearson korelasyon katsayısı 0,91644’tür.
- Ağırlık ve uzunluk2 arasındaki Pearson korelasyon katsayısı 0,91937’dir.
- Ağırlık ile uzunluk3 arasındaki Pearson korelasyon katsayısı 0,92447’dir.
Ve benzeri.
Örnek 3: Korelasyonu bir dağılım grafiğiyle görselleştirin
İki değişken arasındaki korelasyonu görselleştirmek amacıyla bir dağılım grafiği oluşturmak için grafik fonksiyonunu da kullanabiliriz:
/*visualize correlation between Height and Width*/ proc corr data =sashelp.fish plots =scatter( nvar =all);; var HeightWidth; run;
Grafikte yükseklik ve genişlik arasındaki güçlü pozitif ilişkiyi görebiliriz. Yükseklik arttıkça genişlik de artma eğilimindedir.
Grafiğin sol üst köşesinde ayrıca kullanılan toplam gözlemleri, korelasyon katsayısını ve korelasyon katsayısının p değerini de görebiliriz.
Ek kaynaklar
Aşağıdaki eğitimlerde SAS’ta diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:
SAS’ta frekans tabloları nasıl oluşturulur?
SAS’ta tanımlayıcı istatistikler nasıl hesaplanır?