Korelasi di stata: pearson, spearman dan kendall
Dalam statistik, korelasi mengacu pada kekuatan dan arah hubungan antara dua variabel. Nilai koefisien korelasi dapat berkisar antara -1 hingga 1, dengan -1 menunjukkan hubungan negatif sempurna, 0 menunjukkan tidak ada hubungan, dan 1 menunjukkan hubungan positif sempurna.
Ada tiga cara umum untuk mengukur korelasi:
Korelasi Pearson: Digunakan untuk mengukur korelasi antara dua variabel kontinu. (misalnya tinggi dan berat badan)
Korelasi Spearman: Digunakan untuk mengukur korelasi antara dua variabel yang diklasifikasikan. (misalnya peringkat nilai ujian matematika siswa versus peringkat nilai ujian sains mereka di suatu kelas)
Korelasi Kendall: Digunakan bila Anda ingin menggunakan korelasi Spearman tetapi ukuran sampelnya kecil dan terdapat banyak peringkat terkait.
Tutorial ini menjelaskan cara menemukan tiga jenis korelasi di Stata.
Memuat data
Untuk setiap contoh berikut, kita akan menggunakan kumpulan data bernama auto . Anda dapat memuat kumpulan data ini dengan mengetikkan yang berikut ini di kotak Perintah:
gunakan https://www.stata-press.com/data/r13/auto
Kita bisa mendapatkan gambaran singkat tentang kumpulan data dengan mengetikkan yang berikut ini di kotak perintah:
untuk meringkas
Kita dapat melihat bahwa ada total 12 variabel dalam dataset.
Bagaimana menemukan korelasi Pearson di Stata
Kita dapat mencari koefisien korelasi Pearson antara variabel berat dan panjang menggunakan perintah pwcorr :
panjang berat pwcorr
Koefisien korelasi Pearson antara kedua variabel ini adalah sebesar 0,9460 . Untuk menentukan apakah koefisien korelasi ini signifikan, kita dapat mencari nilai p menggunakan perintah sig :
panjang berat pwcorr, sig
Nilai p adalah 0,000 . Karena angka ini kurang dari 0,05, maka korelasi antara kedua variabel ini signifikan secara statistik.
Untuk menemukan koefisien korelasi Pearson untuk beberapa variabel, cukup ketikkan daftar variabel setelah perintah pwcorr :
perpindahan panjang berat pwcorr, sig
Berikut cara menafsirkan hasilnya:
- Korelasi Pearson antara berat badan dan panjang badan = 0,9460 | nilai p = 0,000
- Korelasi Pearson antara berat dan perpindahan = 0,8949 | nilai p = 0,000
- Korelasi Pearson antara perpindahan dan panjang = 0,8351 | nilai p = 0,000
Bagaimana menemukan korelasi Spearman di Stata
Koefisien korelasi Spearman antara variabel trunk dan rep78 dapat dicari dengan menggunakan perintah spearman :
tombak bagasi rep78
Berikut cara menafsirkan hasilnya:
- Jumlah obs: Ini adalah jumlah observasi berpasangan yang digunakan untuk menghitung koefisien korelasi Spearman. Karena beberapa nilai hilang untuk variabel rep78 , Stata hanya menggunakan 69 observasi per pasangan (bukan 74 penuh).
- Rho Spearman: Ini adalah koefisien korelasi Spearman. Dalam hal ini sebesar -0,2235 yang menunjukkan adanya korelasi negatif antara kedua variabel. Ketika yang satu meningkat, yang lain cenderung menurun.
- Masalah > |t| : Ini adalah nilai p yang terkait dengan uji hipotesis. Dalam hal ini, nilai p-value adalah 0,0649 yang menunjukkan bahwa tidak ada korelasi yang signifikan secara statistik antara kedua variabel pada α = 0,05.
Kita dapat menemukan koefisien korelasi Spearman untuk beberapa variabel hanya dengan mengetikkan lebih banyak variabel setelah perintah spearman . Kita dapat mencari koefisien korelasi dan nilai p yang sesuai untuk setiap korelasi berpasangan menggunakan perintah stats(rho p) :
spearman trunk rep78 gear_ratio, statistik (rho p)
Berikut cara menafsirkan hasilnya:
- Korelasi spearman antara trunk dan rep78 = -0.2235 | nilai p = 0,0649
- Korelasi Spearman antara trunk dan gear_ratio = -0.5187 | nilai p = 0,0000
- Korelasi spearman antara gear_ratio dan rep78 = 0,4275 | nilai p = 0,0002
Bagaimana menemukan korelasi Kendall di Stata
Kita dapat mencari koefisien korelasi Kendall antara variabel trunk dan rep78 menggunakan perintah ktau :
ktau bagasi rep78
Berikut cara menafsirkan hasilnya:
- Number of obs: Ini adalah jumlah observasi berpasangan yang digunakan untuk menghitung koefisien korelasi Kendall. Karena beberapa nilai hilang untuk variabel rep78 , Stata hanya menggunakan 69 observasi per pasangan (bukan 74 penuh).
- Kendall’s Tau-b : Merupakan koefisien korelasi Kendall antara kedua variabel. Kami biasanya menggunakan nilai ini daripada tau-a karena tau-b melakukan penyesuaian jika terjadi ikatan. Dalam hal ini tau-b = -0,1752 menunjukkan adanya korelasi negatif antara kedua variabel.
- Masalah > |z| : Ini adalah nilai p yang terkait dengan uji hipotesis. Dalam hal ini, nilai p-value adalah 0,0662 yang menunjukkan bahwa tidak ada korelasi yang signifikan secara statistik antara kedua variabel pada α = 0,05.
Kita dapat menemukan koefisien korelasi Kendall untuk beberapa variabel hanya dengan mengetikkan lebih banyak variabel setelah perintah ktau . Kita dapat mencari koefisien korelasi dan nilai p yang sesuai untuk setiap korelasi berpasangan menggunakan perintah stats(taub p) :
ktau trunk rep78 gear_ratio, statistik (taub p)
- Korelasi Kendall antara trunk dan rep78 = -0.1752 | nilai p = 0,0662
- Korelasi Kendall antara trunk dan gear_ratio = -0.3753 | nilai p = 0,0000
- Korelasi Kendall antara gear_ratio dan rep78 = 0,3206 | nilai p = 0,0006