Cara menghitung korelasi berdasarkan kelompok di r


Anda dapat menggunakan sintaks dasar berikut untuk menghitung korelasi antara dua variabel berdasarkan grup di R:

 library (dplyr)

df %>%
  group_by(group_var) %>%
  summarize(cor=cor(var1, var2))

Sintaks khusus ini menghitung korelasi antara var1 dan var2 , yang dikelompokkan berdasarkan group_var .

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: menghitung korelasi berdasarkan kelompok di R

Misalkan kita mempunyai kerangka data berikut yang berisi informasi tentang pemain bola basket dari tim yang berbeda:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(18, 22, 19, 14, 14, 11, 20, 28),
                 assists=c(2, 7, 9, 3, 12, 10, 14, 21))

#view data frame
df

  team points assists
1 to 18 2
2 to 22 7
3 A 19 9
4 A 14 3
5 B 14 12
6 B 11 10
7 B 20 14
8 B 28 21

Kita dapat menggunakan sintaks berikut dari paket dplyr untuk menghitung korelasi antara poin dan assist , yang dikelompokkan berdasarkan tim :

 library (dplyr)

df %>%
  group_by(team) %>%
  summarize(cor=cor(points, assists))

# A tibble: 2 x 2
  team horn
   
1 A 0.603
2 B 0.982

Dari hasilnya kita dapat melihat:

  • Koefisien korelasi antara poin dan assist untuk Tim A adalah 0,603 .
  • Koefisien korelasi antara poin dan assist Tim B adalah 0,982 .

Karena kedua koefisien korelasinya positif, hal ini menunjukkan bahwa hubungan antara poin dan assist untuk kedua tim adalah positif.

Terkait: Apa yang dianggap sebagai korelasi “kuat”?

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di R:

Cara menghitung nilai unik berdasarkan grup di R
Cara menghitung jumlah berdasarkan kelompok di R
Cara menghitung mean per grup di R
Cara menghitung statistik ringkasan berdasarkan grup di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *