R'de birden fazla değişken arasındaki korelasyon nasıl hesaplanır


İki değişken arasındaki ilişkiyi ölçmenin bir yolu, iki değişken arasındaki doğrusal ilişkinin bir ölçüsü olan Pearson korelasyon katsayısını kullanmaktır . Her zaman -1 ile 1 arasında bir değer alır; burada:

  • -1, iki değişken arasında tamamen negatif bir doğrusal korelasyonu gösterir
  • 0, iki değişken arasında doğrusal bir korelasyon olmadığını gösterir
  • 1, iki değişken arasında mükemmel pozitif doğrusal bir korelasyonu gösterir

Bu eğitimde, aşağıdaki veri çerçevesini örnek olarak kullanarak R’deki birden çok değişken arasındaki korelasyonun nasıl hesaplanacağı açıklanmaktadır:

 #create data frame
df <- data.frame(a <- c(2, 3, 3, 5, 6, 9, 14, 15, 19, 21, 22, 23),
                 b <- c(23, 24, 24, 23, 17, 28, 38, 34, 35, 39, 41, 43),
                 c <- c(13, 14, 14, 14, 15, 17, 18, 19, 22, 20, 24, 26),
                 d <- c(6, 6, 7, 8, 8, 8, 7, 6, 5, 3, 3, 2))

Örnek 1: İki değişken arasındaki korelasyon

Aşağıdaki kod, veri çerçevesindeki iki değişken arasındaki korelasyonun nasıl hesaplanacağını gösterir:

 cor(df$a, df$b)

[1] 0.9279869

Örnek 2: Çeşitli değişkenler arasındaki korelasyon

Aşağıdaki kod, veri çerçevesindeki üç değişken arasındaki korelasyonun nasıl hesaplanacağını gösterir:

 cor(df[, c(' a ', ' b ', ' c ')])

          ABC
a 1.0000000 0.9279869 0.9604329
b 0.9279869 1.0000000 0.8942139
c 0.9604329 0.8942139 1.0000000

Sonucun yorumlanma şekli şu şekildedir:

  • a ve b arasındaki korelasyon 0,9279869’dur.
  • a ve c arasındaki korelasyon 0,9604329’dur.
  • B ve c arasındaki korelasyon 0,8942139’dur.

Örnek 3: Tüm değişkenler arasındaki korelasyon

Aşağıdaki kod, bir veri çerçevesindeki tüm değişkenler arasındaki korelasyonun nasıl hesaplanacağını gösterir:

 cor(df)

           abcd
a 1.0000000 0.9279869 0.9604329 -0.7915488
b 0.9279869 1.0000000 0.8942139 -0.7917973
c 0.9604329 0.8942139 1.0000000 -0.8063549
d -0.7915488 -0.7917973 -0.8063549 1.0000000

Örnek 4: Yalnızca sayısal değişkenler arasındaki korelasyon

Aşağıdaki kod, bir veri çerçevesindeki yalnızca sayısal değişkenler arasındaki korelasyonun nasıl hesaplanacağını gösterir:

 cor(df[, unlist ( lapply (df, is. numeric ))])

           abcd
a 1.0000000 0.9279869 0.9604329 -0.7915488
b 0.9279869 1.0000000 0.8942139 -0.7917973
c 0.9604329 0.8942139 1.0000000 -0.8063549
d -0.7915488 -0.7917973 -0.8063549 1.0000000

Örnek 5: Korelasyonların görselleştirilmesi

Aşağıdaki kod, ikili grafiğin nasıl oluşturulacağını gösterir; bu, değişkenlerin her ikili kombinasyonu arasındaki ilişkiyi görselleştirmenize olanak tanıyan bir grafik türüdür:

 #load psych package
library(psych)

#create pairs plot
peers. panels (df)

Ek kaynaklar

R’de kısmi korelasyon nasıl hesaplanır
R’de nokta-çift serili korelasyon nasıl hesaplanır
R’de kayan korelasyon nasıl hesaplanır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir