R'de kısmi korelasyon nasıl hesaplanır
İstatistikte, iki değişken arasındaki doğrusal ilişkiyi ölçmek için sıklıkla Pearson korelasyon katsayısını kullanırız.
Ancak bazen üçüncü bir değişkeni kontrol ederken iki değişken arasındaki ilişkiyi anlamak isteriz.
Örneğin, öğrencinin sınıftaki mevcut notunu kontrol ederken, öğrencinin ders çalışma saati ile final sınav notu arasındaki ilişkiyi ölçmek istediğimizi varsayalım.
Bu durumda çalışılan saat ile final sınav notu arasındaki ilişkiyi ölçmek için kısmi korelasyonu kullanabiliriz.
Bu eğitimde R’de kısmi bir korelasyonun nasıl hesaplanacağı açıklanmaktadır.
Örnek: R’de kısmi korelasyon
10 öğrencinin mevcut notunu, çalışılan toplam saati ve final sınav notunu gösteren aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:
#create data frame df <- data. frame (currentGrade = c(82, 88, 75, 74, 93, 97, 83, 90, 90, 80), hours = c(4, 3, 6, 5, 4, 5, 8, 7, 4, 6), examScore = c(88, 85, 76, 70, 92, 94, 89, 85, 90, 93)) #view data frame df currentGrade hours examScore 1 82 4 88 2 88 3 85 3 75 6 76 4 74 5 70 5 93 4 92 6 97 5 94 7 83 8 89 8 90 7 85 9 90 4 90 10 80 6 93
Veri çerçevesindeki değişkenlerin her ikili kombinasyonu arasındaki kısmi korelasyonu hesaplamak için ppcor kütüphanesindeki pcor() fonksiyonunu kullanabiliriz:
library (ppcor)
#calculate partial correlations
pcor(df)
$estimate
currentGrade hours examScore
currentGrade 1.0000000 -0.3112341 0.7355673
hours -0.3112341 1.0000000 0.1906258
examScore 0.7355673 0.1906258 1.0000000
$p.value
currentGrade hours examScore
currentGrade 0.00000000 0.4149353 0.02389896
hours 0.41493532 0.0000000 0.62322848
examScore 0.02389896 0.6232285 0.00000000
$statistic
currentGrade hours examScore
currentGrade 0.0000000 -0.8664833 2.8727185
hours -0.8664833 0.0000000 0.5137696
examScore 2.8727185 0.5137696 0.0000000
$n
[1] 10
$gp
[1] 1
$method
[1] "pearson"
Sonucun nasıl yorumlanacağı aşağıda açıklanmıştır:
Çalışılan saat ile final sınav notu arasındaki kısmi korelasyon:
Çalışılan saat ile final sınavı notu arasındaki kısmi korelasyon 0,191’dir ve bu küçük bir pozitif korelasyonu temsil eder. Çalışma saatlerinin sayısı arttıkça, mevcut notun sabit kaldığı varsayılarak sınav puanları da artma eğilimindedir.
Bu kısmi korelasyonun p değeri 0,623’tür ve α = 0,05’te istatistiksel olarak anlamlı değildir.
Mevcut not ile final sınavı notu arasındaki kısmi korelasyon:
Mevcut not ile final sınavı notu arasındaki kısmi korelasyon 0,736’dır ve bu da güçlü bir pozitif korelasyonu temsil eder. Mevcut not arttıkça, çalışılan saat sayısının sabit kaldığı varsayılarak sınav puanları da artma eğilimindedir.
Bu kısmi korelasyonun p değeri 0,024’tür ve bu, α = 0,05’te istatistiksel olarak anlamlıdır.
Mevcut not ile çalışılan saat arasındaki kısmi korelasyon:
Mevcut not, çalışılan saat ve final sınavı notu arasındaki kısmi korelasyon -0,311 olup, bu hafif bir negatif korelasyonu temsil etmektedir. Final sınav notunun sabit kaldığı varsayılarak, mevcut not arttıkça final sınav notu düşme eğilimi gösterir.
Bu kısmi korelasyonun p değeri 0,415’tir ve α = 0,05’te istatistiksel olarak anlamlı değildir.
Sonuç ayrıca bize kısmi korelasyonu hesaplamak için kullanılan yöntemin “Pearson” olduğunu da söylüyor.
PCor() işlevinde, korelasyonları hesaplamak için alternatif yöntemler olarak “kendall” veya “pearson”u da belirtebiliriz.
Ek kaynaklar
Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
R’de Spearman sıralama korelasyonu nasıl hesaplanır
R’de çapraz korelasyon nasıl hesaplanır
R’de kayan korelasyon nasıl hesaplanır
R’de nokta-çift serili korelasyon nasıl hesaplanır