R'deki korelasyon katsayılarını hesaplamak için cor() nasıl kullanılır?
Değişkenler arasındaki korelasyon katsayılarını hesaplamak için R’deki cor() işlevini kullanabilirsiniz.
Bu özelliği kullanmanın en yaygın yolları şunlardır:
Yöntem 1: iki değişken arasındaki Pearson korelasyon katsayısını hesaplayın
cor(df$x, df$y)
İki sürekli değişken arasındaki korelasyonu hesaplarken Pearson korelasyon katsayısını kullanın. (örneğin boy ve kilo)
Yöntem 2: Veri çerçevesindeki tüm sayısal değişkenler arasındaki Pearson korelasyon katsayısını hesaplayın
cor(df)
Bu yöntem, bir veri çerçevesindeki sayısal değişkenlerin her ikili kombinasyonu arasındaki Pearson korelasyon katsayısını içeren birkorelasyon matrisi döndürecektir.
Yöntem 3: İki değişken arasındaki Spearman korelasyon katsayısını hesaplayın
cor(df$x, df$y, method=' spearman ')
Sıralanan iki değişken arasındaki korelasyonu hesaplarken Spearman’ın korelasyon katsayısını kullanın. (örneğin bir öğrencinin matematik sınavı puanının sıralaması ile fen bilimleri sınavı puanının sınıftaki sıralaması)
Yöntem 4: iki değişken arasındaki Kendall korelasyon katsayısını hesaplayın
cor(df$x, df$y, method=' kendall ')
Spearman korelasyonunu kullanmak istediğinizde Kendall korelasyon katsayısını kullanın ancak örneklem boyutu küçük ve çok sayıda bağ var.
Aşağıdaki örnekler, R’de, sekiz farklı öğrenci için ders çalışmaya harcanan saat sayısını, alınan uygulama sınavlarının sayısını ve final sınav notunu gösteren aşağıdaki veri çerçevesiyle her yöntemin pratikte nasıl kullanılacağını gösterir:
#create data frame
df <- data. frame (hours=c(1, 1, 3, 2, 4, 3, 5, 6),
prac_exams=c(4, 3, 3, 2, 3, 2, 1, 4),
score=c(69, 74, 74, 70, 89, 85, 99, 90))
#view data frame
df
hours prac_exams score
1 1 4 69
2 1 3 74
3 3 3 74
4 2 2 70
5 4 3 89
6 3 2 85
7 5 1 99
8 6 4 90
Örnek 1: İki değişken arasındaki Pearson korelasyon katsayısını hesaplayın
Aşağıdaki kod, saatler ve puan değişkenleri arasındaki Pearson korelasyon katsayısını hesaplamak için cor() işlevinin nasıl kullanılacağını gösterir:
#calculate Pearson correlation coefficient between hours and score
cor(df$hours, df$score)
[1] 0.8600528
Saat ile puan arasındaki Pearson korelasyon katsayısı 0,86 olarak bulunmuştur.
Veri çerçevenizde NA değerleri varsa, yalnızca NA değerinin bulunmadığı satırları kullanmak için use=’complete.obs’ bağımsız değişkenini kullanabileceğinizi unutmayın:
#calculate Pearson correlation coefficient and ignore any rows with NA cor(df$hours, df$score, use=' complete.obs ')
Örnek 2: Tüm sayısal değişkenler arasındaki Pearson korelasyon katsayısını hesaplayın
Aşağıdaki kod, veri çerçevesindeki tüm sayısal değişkenler arasında Pearson korelasyon katsayısını içeren bir korelasyon matrisi oluşturmak için cor() işlevinin nasıl kullanılacağını gösterir:
#calculate Pearson correlation coefficient between all numeric variables
cor(df)
hours prac_exams score
hours 1.0000000 -0.1336063 0.8600528
prac_exams -0.1336063 1.0000000 -0.3951028
score 0.8600528 -0.3951028 1.0000000
Sonucun nasıl yorumlanacağı aşağıda açıklanmıştır:
- Saatler ile prac_exams arasındaki Pearson korelasyon katsayısı -0,13’tür .
- Saat ile puan arasındaki Pearson korelasyon katsayısı 0,86’dır .
- Prac_exams ile puan arasındaki Pearson korelasyon katsayısı -0,39’dur .
Not : Her bir değişken ile kendisi arasındaki Pearson korelasyon katsayısı her zaman 1’dir, bu nedenle korelasyon matrisinin köşegeni boyunca her değer 1’dir.
Örnek 3: İki değişken arasındaki Spearman korelasyon katsayısını hesaplayın
Aşağıdaki kod, saat ve prac_exams değişkenleri arasındaki Spearman korelasyon katsayısını hesaplamak için cor() işlevinin nasıl kullanılacağını gösterir:
#calculate Spearman correlation coefficient between hours and prac_exams cor(df$hours, df$prac_exams, method=' spearman ') [1] -0.1250391
Saatler ile prac_exams arasındaki Spearman korelasyon katsayısı -0,125 olarak çıkıyor.
Örnek 4: İki değişken arasındaki Kendall korelasyon katsayısını hesaplayın
Aşağıdaki kod, saat ve prac_exams değişkenleri arasındaki Kendall korelasyon katsayısını hesaplamak için cor() işlevinin nasıl kullanılacağını gösterir:
#calculate Kendall's correlation coefficient between hours and prac_exams cor(df$hours, df$prac_exams, method=' kendall ') [1] -0.1226791
Saatler ile prac_exams arasındaki Kendall korelasyon katsayısı -0,123 olarak çıkıyor.
Ek kaynaklar
Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
R’de kayan korelasyon nasıl hesaplanır
R’de otokorelasyon nasıl hesaplanır
R’de kısmi korelasyon nasıl hesaplanır