Sas'ta korelasyon matrisi nasıl oluşturulur (örnekle)


Korelasyon matrisi, bir veri setindeki değişkenler arasındaki korelasyon katsayılarını gösteren kare bir tablodur.

Bir veri kümesindeki değişkenler arasında var olan doğrusal ilişkilerin gücünü anlamanın hızlı bir yolunu sağlar.

Belirli bir veri kümesi için bir korelasyon matrisi oluşturmak amacıyla SAS’ta PROC CORR deyimini kullanabilirsiniz:

 /*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ;

Varsayılan olarak bu, veri kümesindeki tüm sayısal değişkenler arasındaki korelasyon katsayılarını görüntüleyen bir matris oluşturacaktır.

Korelasyon matrisine yalnızca belirli değişkenleri dahil etmek için VAR ifadesini kullanabilirsiniz:

 /*create correlation matrix using only var1, var2 and var3 in my_data*/
proc corr data =my_data;
    var var1, var2, var3;
run ;

Aşağıdaki örnek, SAS’ta bir korelasyon matrisinin nasıl oluşturulacağını gösterir.

Örnek: SAS’ta Korelasyon Matrisi Oluşturma

SAS’ta çeşitli basketbol oyuncuları hakkında bilgi içeren aşağıdaki veri kümesine sahip olduğumuzu varsayalım:

 /*create dataset*/
data my_data;
    input team $ assists rebounds points;
    datalines ;
A 4 12 22
A 5 14 24
A 5 13 26
A 6 7 26
B 7 8 29
B 8 8 32
B 8 9 20
B 10 13 14
;
run ;

/*view dataset*/
proc print data =my_data; 

Varsayılan olarak veri kümesindeki her sayısal değişkeni içeren bir korelasyon matrisi oluşturmak için PROC CORR ifadesini kullanabiliriz:

 /*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ; 

SAS'taki korelasyon matrisi

Çıktı, ilk tablodaki sayısal değişkenlerin özet istatistiklerini bir korelasyon matrisiyle birlikte görüntüler.

“Takım” değişkeninin sayısal bir değişken olmadığı için korelasyon matrisine dahil edilmediğine dikkat edin.

Korelasyon matrisi değerlerinin nasıl yorumlanacağı aşağıda açıklanmıştır:

(1) Asistler ve ribaundlar arasındaki Pearson korelasyon katsayısı (r) -0,24486’dır . Karşılık gelen p değeri 0,5589’dur .

r’nin sıfırdan küçük olması bize bu iki değişken arasında negatif doğrusal bir ilişki olduğunu söyler. Ancak p değeri 0,05’ten küçük olmadığı için bu korelasyon istatistiksel olarak anlamlı değildir.

(2) Asistler ve sayılar arasındaki Pearson korelasyon katsayısı (r) -0,32957’dir . Karşılık gelen p değeri 0,4253’tür .

Bu iki değişken arasında negatif doğrusal bir ilişki vardır ancak istatistiksel olarak anlamlı değildir.

(3) Ribaundlar ile sayılar arasındaki Pearson korelasyon katsayısı (r) -0,52209’dur . Karşılık gelen p değeri 0,1844’tür .

Bu iki değişken arasında negatif doğrusal bir ilişki vardır ancak istatistiksel olarak anlamlı değildir.

Korelasyon matrisine yalnızca belirli sayısal değişkenleri dahil etmek için VAR ifadesini de kullanabileceğimizi unutmayın:

 /*create correlation matrix using only assists and rebounds variables*/
proc corr data =my_data;
    var assists rebounds;
run ; 

Bu korelasyon matrisine yalnızca asist ve ribaund değişkenlerinin dahil edildiğini unutmayın.

Ek kaynaklar

Aşağıdaki eğitimlerde SAS’ta diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

SAS’ta Dağılım Grafiği Matrisi Nasıl Oluşturulur
SAS’ta PivotTable’lar Nasıl Oluşturulur
SAS’ta Varyans Enflasyon Faktörü (VIF) nasıl hesaplanır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir