R'de korelasyon matrisi nasıl oluşturulur (4 örnek)
Korelasyon matrisi, bir veri setindeki değişkenler arasındaki korelasyon katsayılarını gösteren kare bir tablodur.
Bir veri kümesindeki değişkenler arasında var olan doğrusal ilişkilerin gücünü anlamanın hızlı bir yolunu sağlar.
R’de korelasyon matrisi oluşturmanın dört yaygın yolu vardır:
Yöntem 1: kor fonksiyonu (basit bir korelasyon katsayıları matrisi elde etmek için)
cor(df)
Yöntem 2: rcorr işlevi (korelasyon katsayılarının p değerlerini elde etmek için)
library (Hmisc)
rcorr( as.matrix (df))
Yöntem 3: corrplot işlevi (korelasyon matrisini görselleştirmek için)
library (corplot)
corrplot(cor(df))
Yöntem 4: ggcorrplot işlevi (korelasyon matrisini görselleştirmek için)
library (ggcorrplot)
ggcorrplot(cor(df))
Aşağıdaki örnekler, R’de her yöntemin aşağıdaki veri çerçevesiyle nasıl kullanılacağını gösterir:
#create data frame
df <- data. frame (assists=c(4, 5, 5, 6, 7, 8, 8, 10),
rebounds=c(12, 14, 13, 7, 8, 8, 9, 13),
points=c(22, 24, 26, 26, 29, 32, 20, 14))
#view data frame
df
assists rebound points
1 4 12 22
2 5 14 24
3 5 13 26
4 6 7 26
5 7 8 29
6 8 8 32
7 8 9 20
8 10 13 14
Örnek 1: Cor işlevi
Veri çerçevemizdeki her değişken arasındaki korelasyon katsayılarını gösteren bir korelasyon matrisi oluşturmak için R base cor() fonksiyonunu kullanabiliriz:
#create correlation matrix
cor(df)
assists rebound points
assists 1.0000000 -0.2448608 -0.3295730
rebounds -0.2448608 1.0000000 -0.5220917
points -0.3295730 -0.5220917 1.0000000
Tablonun köşegeni boyunca korelasyon katsayılarının tümü 1’e eşittir çünkü her değişken kendisiyle mükemmel bir korelasyona sahiptir.
Diğer tüm korelasyon katsayıları, değişkenlerin farklı ikili kombinasyonları arasındaki korelasyonu gösterir. Örneğin:
- Asistler ve ribaundlar arasındaki korelasyon katsayısı -0,245’tir .
- Asistlerle sayılar arasındaki korelasyon katsayısı -0,330 .
- Ribaundlarla sayılar arasındaki korelasyon katsayısı -0,522’dir .
Örnek 2: rcorr işlevi
Veri çerçevemizdeki her değişken arasındaki korelasyon katsayılarını gösteren bir korelasyon matrisi oluşturmak için R’deki Hmisc paketindeki rcorr() fonksiyonunu kullanabiliriz:
library (Hmisc)
#create matrix of correlation coefficients and p-values
rcorr( as.matrix (df))
assists rebound points
assists 1.00 -0.24 -0.33
rebounds -0.24 1.00 -0.52
points -0.33 -0.52 1.00
n=8
P
assists rebound points
assists 0.5589 0.4253
rebounds 0.5589 0.1844
points 0.4253 0.1844
İlk matris değişkenler arasındaki korelasyon katsayılarını gösterir ve ikinci matris karşılık gelen p değerlerini gösterir.
Örneğin asist ve ribaundlar arasındaki korelasyon katsayısı -0,24 ve bu korelasyon katsayısının p değeri 0,5589’dur .
Bu bize iki değişken arasındaki korelasyonun negatif olduğunu ancak p değeri 0,05’ten az olmadığı için istatistiksel olarak anlamlı bir korelasyon olmadığını söyler.
Örnek 3: Doğrulama işlevi
Korelasyon matrisini görselleştirmek için R’deki corrplot paketindeki corrplot() fonksiyonunu kullanabiliriz:
library (corplot)
#visualize correlation matrix
corrplot(cor(df))
Korelasyon matrisindeki dairelerin rengi ve boyutu, her değişken arasındaki korelasyonu görselleştirmemize yardımcı olur.
Örneğin asist ve ribaund değişkenlerinin kesiştiği dairenin küçük ve açık kırmızı olması bize korelasyonun zayıf ve negatif olduğunu anlatıyor.
Örnek 4: Doğrulama işlevi
Korelasyon matrisini görselleştirmek için R’deki ggcorrplot paketindeki ggcorrplot() fonksiyonunu kullanabiliriz:
library (ggcorrplot)
#visualize correlation matrix
ggcorrplot(cor(df))
Korelasyon matrisindeki karelerin rengi, her değişken arasındaki korelasyonları görselleştirmemize yardımcı olur.
Ek kaynaklar
Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
R’de Spearman sıralama korelasyonu nasıl hesaplanır
R’de kısmi korelasyon nasıl hesaplanır
R’de kayan korelasyon nasıl hesaplanır