Cara menghitung korelasi parsial di r
Dalam statistik, kita sering menggunakan koefisien korelasi Pearson untuk mengukur hubungan linier antara dua variabel.
Namun, terkadang kita ingin memahami hubungan antara dua variabel sambil mengendalikan variabel ketiga .
Misalnya, kita ingin mengukur hubungan antara jumlah jam belajar siswa dan nilai ujian akhir, sambil mengontrol nilai siswa saat ini di kelas.
Dalam hal ini, kita dapat menggunakan korelasi parsial untuk mengukur hubungan antara jam belajar dan nilai ujian akhir.
Tutorial ini menjelaskan cara menghitung korelasi parsial di R.
Contoh: korelasi parsial pada R
Misalkan kita mempunyai kerangka data berikut yang menampilkan nilai saat ini, total jam belajar, dan nilai ujian akhir untuk 10 siswa:
#create data frame df <- data. frame (currentGrade = c(82, 88, 75, 74, 93, 97, 83, 90, 90, 80), hours = c(4, 3, 6, 5, 4, 5, 8, 7, 4, 6), examScore = c(88, 85, 76, 70, 92, 94, 89, 85, 90, 93)) #view data frame df currentGrade hours examScore 1 82 4 88 2 88 3 85 3 75 6 76 4 74 5 70 5 93 4 92 6 97 5 94 7 83 8 89 8 90 7 85 9 90 4 90 10 80 6 93
Untuk menghitung korelasi parsial antara setiap kombinasi berpasangan variabel dalam kerangka data, kita dapat menggunakan fungsi pcor() dari perpustakaan ppcor :
library (ppcor)
#calculate partial correlations
pcor(df)
$estimate
currentGrade hours examScore
currentGrade 1.0000000 -0.3112341 0.7355673
hours -0.3112341 1.0000000 0.1906258
examScore 0.7355673 0.1906258 1.0000000
$p.value
currentGrade hours examScore
currentGrade 0.00000000 0.4149353 0.02389896
hours 0.41493532 0.0000000 0.62322848
examScore 0.02389896 0.6232285 0.00000000
$statistic
currentGrade hours examScore
currentGrade 0.0000000 -0.8664833 2.8727185
hours -0.8664833 0.0000000 0.5137696
examScore 2.8727185 0.5137696 0.0000000
$n
[1] 10
$gp
[1] 1
$method
[1] "pearson"
Berikut cara menafsirkan hasilnya:
Korelasi parsial antara jam belajar dan nilai ujian akhir:
Korelasi parsial antara jam belajar dan nilai ujian akhir adalah 0,191 , yang menunjukkan korelasi positif yang kecil. Seiring bertambahnya jumlah jam belajar, nilai ujian pun cenderung meningkat, dengan asumsi nilai saat ini tetap konstan.
Nilai p untuk korelasi parsial ini adalah 0,623 , yang tidak signifikan secara statistik pada α = 0,05.
Korelasi parsial antara nilai saat ini dan nilai ujian akhir:
Korelasi parsial antara nilai saat ini dan nilai ujian akhir adalah 0,736 , yang menunjukkan korelasi positif yang kuat. Seiring dengan peningkatan nilai saat ini, nilai ujian juga cenderung meningkat, dengan asumsi jumlah jam belajar tetap.
Nilai p untuk korelasi parsial ini adalah 0,024 , yang signifikan secara statistik pada α = 0,05.
Korelasi parsial antara nilai saat ini dan jam belajar:
Korelasi parsial antara nilai saat ini, jam belajar, dan nilai ujian akhir adalah -0,311 , yang menunjukkan korelasi yang sedikit negatif. Dengan bertambahnya nilai saat ini maka nilai ujian akhir cenderung menurun dengan asumsi nilai ujian akhir tetap.
Nilai p untuk korelasi parsial ini adalah 0,415 , yang tidak signifikan secara statistik pada α = 0,05.
Hasilnya juga menunjukkan bahwa metode yang digunakan untuk menghitung korelasi parsial adalah “Pearson”.
Dalam fungsi pcor() , kita juga dapat menentukan “kendall” atau “pearson” sebagai metode alternatif untuk menghitung korelasi.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:
Cara menghitung korelasi rank Spearman di R
Cara menghitung korelasi silang di R
Cara menghitung korelasi geser di R
Cara menghitung korelasi titik-biserial di R