Cara menghitung korelasi di sas (dengan contoh)
Salah satu cara untuk mengukur hubungan antara dua variabel adalah dengan menggunakan koefisien korelasi Pearson , yang mengukur hubungan linear antara dua variabel .
Itu selalu mengambil nilai antara -1 dan 1 di mana:
- -1 menunjukkan korelasi linier negatif sempurna antara dua variabel
- 0 menunjukkan tidak ada korelasi linier antara dua variabel
- Angka 1 menunjukkan korelasi linier positif sempurna antara dua variabel
Semakin jauh koefisien korelasi dari nol maka semakin kuat hubungan kedua variabel tersebut.
Contoh berikut menunjukkan cara menggunakan proc corr di SAS untuk menghitung koefisien korelasi antar variabel dalam kumpulan data terintegrasi SAS yang disebut Fish , yang berisi berbagai pengukuran untuk 159 ikan berbeda yang ditangkap di sebuah danau di Finlandia.
Kita dapat menggunakan proc print untuk menampilkan 10 observasi pertama dari kumpulan data ini:
/*view first 10 observations from Fish dataset*/ proc print data =sashelp.Fish( obs = 10 ); run ;
Contoh 1: Korelasi antara dua variabel
Kita dapat menggunakan kode berikut untuk menghitung koefisien korelasi Pearson antara variabel Tinggi dan Lebar:
/*calculate correlation coefficient between Height and Width*/ proc corr data =sashelp.fish; var HeightWidth; run ;
Tabel pertama menampilkan statistik ringkasan untuk tinggi dan lebar.
Tabel kedua menampilkan koefisien korelasi Pearson antara kedua variabel, termasuk nilai p yang menunjukkan apakah korelasi tersebut signifikan secara statistik.
Dari hasilnya kita dapat melihat:
- Koefisien korelasi Pearson: 0,79288
- Nilai P: <0,0001
Hal ini menunjukkan bahwa terdapat korelasi positif yang kuat antara tinggi dan lebar dan korelasi tersebut signifikan secara statistik karena nilai p kurang dari α = 0,05.
Terkait: Apa yang dianggap sebagai korelasi “kuat”?
Contoh 2: Korelasi antar semua variabel
Kita dapat menggunakan kode berikut untuk menghitung koefisien korelasi Pearson antara semua kombinasi variabel berpasangan dalam kumpulan data:
/*calculate correlation coefficient between all pairwise combinations of variables*/ proc corr data =sashelp.fish; run;
Hasilnya menampilkan matriks korelasi , yang berisi koefisien korelasi Pearson dan nilai p yang sesuai untuk setiap kombinasi berpasangan variabel numerik dalam kumpulan data.
Misalnya:
- Koefisien korelasi Pearson antara berat dan panjang1 adalah 0,91644.
- Koefisien korelasi Pearson antara berat dan panjang2 adalah 0,91937.
- Koefisien korelasi Pearson antara berat dan panjang3 adalah 0,92447.
Dan seterusnya.
Contoh 3: Visualisasikan korelasinya dengan plot sebar
Kita juga dapat menggunakan fungsi plots untuk membuat plot sebar guna memvisualisasikan korelasi antara dua variabel:
/*visualize correlation between Height and Width*/ proc corr data =sashelp.fish plots =scatter( nvar =all);; var HeightWidth; run;
Pada grafik kita dapat melihat korelasi positif yang kuat antara tinggi dan lebar. Semakin bertambah tinggi maka lebarnya pun cenderung bertambah.
Di pojok kiri atas grafik kita juga dapat melihat total observasi yang digunakan, koefisien korelasi dan nilai p dari koefisien korelasi.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di SAS:
Cara membuat tabel frekuensi di SAS
Cara menghitung statistik deskriptif di SAS