Cara membuat matriks korelasi di sas (dengan contoh)
Matriks korelasi adalah tabel persegi yang menunjukkan koefisien korelasi antar variabel dalam suatu kumpulan data.
Ini memberikan cara cepat untuk memahami kekuatan hubungan linier yang ada antar variabel dalam kumpulan data.
Anda dapat menggunakan pernyataan PROC CORR di SAS untuk membuat matriks korelasi untuk kumpulan data tertentu:
/*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ;
Secara default, ini akan membuat matriks yang menampilkan koefisien korelasi antara semua variabel numerik dalam kumpulan data.
Untuk memasukkan variabel tertentu saja ke dalam matriks korelasi, Anda dapat menggunakan pernyataan VAR :
/*create correlation matrix using only var1, var2 and var3 in my_data*/
proc corr data =my_data;
var var1, var2, var3;
run ;
Contoh berikut menunjukkan cara membuat matriks korelasi di SAS.
Contoh: Membuat Matriks Korelasi di SAS
Misalkan kita memiliki kumpulan data berikut di SAS yang berisi informasi tentang berbagai pemain bola basket:
/*create dataset*/
data my_data;
input team $ assists rebounds points;
datalines ;
A 4 12 22
A 5 14 24
A 5 13 26
A 6 7 26
B 7 8 29
B 8 8 32
B 8 9 20
B 10 13 14
;
run ;
/*view dataset*/
proc print data =my_data;
Kita dapat menggunakan pernyataan PROC CORR untuk membuat matriks korelasi yang mencakup setiap variabel numerik dalam kumpulan data secara default:
/*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ;
Outputnya menampilkan ringkasan statistik variabel numerik pada tabel pertama bersama dengan matriks korelasi.
Perhatikan bahwa variabel “tim” tidak dimasukkan dalam matriks korelasi karena bukan merupakan variabel numerik.
Berikut cara menginterpretasikan nilai matriks korelasi:
(1) Koefisien korelasi Pearson (r) antara assist dan rebound adalah -0,24486 . Nilai p yang sesuai adalah 0,5589 .
Karena r lebih kecil dari nol, hal ini menunjukkan bahwa terdapat hubungan linier negatif antara kedua variabel. Namun, nilai p tidak kurang dari 0,05, sehingga korelasi ini tidak signifikan secara statistik.
(2) Koefisien korelasi Pearson (r) antara assist dan poin adalah -0,32957 . Nilai p yang sesuai adalah 0,4253 .
Terdapat hubungan linier negatif antara kedua variabel ini namun tidak signifikan secara statistik.
(3) Koefisien korelasi Pearson (r) antara rebound dan poin adalah -0,52209 . Nilai p yang sesuai adalah 0,1844 .
Terdapat hubungan linier negatif antara kedua variabel ini namun tidak signifikan secara statistik.
Perhatikan bahwa kita juga dapat menggunakan pernyataan VAR untuk hanya memasukkan variabel numerik tertentu ke dalam matriks korelasi:
/*create correlation matrix using only assists and rebounds variables*/
proc corr data =my_data;
var assists rebounds;
run ;
Perhatikan bahwa hanya variabel assist dan rebound yang dimasukkan dalam matriks korelasi ini.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di SAS:
Cara Membuat Matriks Scatterplot di SAS
Cara Membuat PivotTable di SAS
Cara menghitung Variance Inflation Factor (VIF) di SAS