Cara menghitung korelasi berdasarkan kelompok di r
Anda dapat menggunakan sintaks dasar berikut untuk menghitung korelasi antara dua variabel berdasarkan grup di R:
library (dplyr)
df %>%
group_by(group_var) %>%
summarize(cor=cor(var1, var2))
Sintaks khusus ini menghitung korelasi antara var1 dan var2 , yang dikelompokkan berdasarkan group_var .
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh: menghitung korelasi berdasarkan kelompok di R
Misalkan kita mempunyai kerangka data berikut yang berisi informasi tentang pemain bola basket dari tim yang berbeda:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(18, 22, 19, 14, 14, 11, 20, 28),
assists=c(2, 7, 9, 3, 12, 10, 14, 21))
#view data frame
df
team points assists
1 to 18 2
2 to 22 7
3 A 19 9
4 A 14 3
5 B 14 12
6 B 11 10
7 B 20 14
8 B 28 21
Kita dapat menggunakan sintaks berikut dari paket dplyr untuk menghitung korelasi antara poin dan assist , yang dikelompokkan berdasarkan tim :
library (dplyr)
df %>%
group_by(team) %>%
summarize(cor=cor(points, assists))
# A tibble: 2 x 2
team horn
1 A 0.603
2 B 0.982
Dari hasilnya kita dapat melihat:
- Koefisien korelasi antara poin dan assist untuk Tim A adalah 0,603 .
- Koefisien korelasi antara poin dan assist Tim B adalah 0,982 .
Karena kedua koefisien korelasinya positif, hal ini menunjukkan bahwa hubungan antara poin dan assist untuk kedua tim adalah positif.
Terkait: Apa yang dianggap sebagai korelasi “kuat”?
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di R:
Cara menghitung nilai unik berdasarkan grup di R
Cara menghitung jumlah berdasarkan kelompok di R
Cara menghitung mean per grup di R
Cara menghitung statistik ringkasan berdasarkan grup di R