R'de gruba göre korelasyon nasıl hesaplanır


R’de iki değişken arasındaki korelasyonu gruba göre hesaplamak için aşağıdaki temel sözdizimini kullanabilirsiniz:

 library (dplyr)

df %>%
  group_by(group_var) %>%
  summarize(cor=cor(var1, var2))

Bu özel sözdizimi, group_var’a göre gruplandırılmış var1 ve var2 arasındaki korelasyonu hesaplar.

Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.

Örnek: R’de gruba göre korelasyonu hesaplama

Farklı takımlardaki basketbolcular hakkında bilgi içeren aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(18, 22, 19, 14, 14, 11, 20, 28),
                 assists=c(2, 7, 9, 3, 12, 10, 14, 21))

#view data frame
df

  team points assists
1 to 18 2
2 to 22 7
3 A 19 9
4 A 14 3
5 B 14 12
6 B 11 10
7 B 20 14
8 B 28 21

Takıma göre gruplandırılmış olarak puanlar ve asistler arasındaki korelasyonu hesaplamak için dplyr paketindeki aşağıdaki sözdizimini kullanabiliriz:

 library (dplyr)

df %>%
  group_by(team) %>%
  summarize(cor=cor(points, assists))

# A tibble: 2 x 2
  team horn
   
1 A 0.603
2 B 0.982

Sonuçtan şunları görebiliriz:

  • A takımının puanları ve asistleri arasındaki korelasyon katsayısı 0,603’tür .
  • B Takımının puanları ve asistleri arasındaki korelasyon katsayısı 0,982’dir .

Her iki korelasyon katsayısı da pozitif olduğundan, bu bize her iki takım için de sayılar ve asistler arasındaki ilişkinin pozitif olduğunu gösteriyor.

İlgili: Ne “güçlü” bir korelasyon olarak kabul edilir?

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:

R’de gruba göre benzersiz değerler nasıl sayılır?
R’de gruba göre toplam nasıl hesaplanır
R’de grup başına ortalama nasıl hesaplanır
R’de gruba göre özet istatistikler nasıl hesaplanır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir