Cara menghitung observasi per kelompok di r
Seringkali Anda mungkin tertarik untuk menghitung jumlah observasi per grup di R.
Untungnya, hal ini mudah dilakukan dengan menggunakan fungsi count() pada perpustakaan dplyr .
Tutorial ini menjelaskan beberapa contoh penggunaan praktis fungsi ini menggunakan bingkai data berikut:
#create data frame df <- data.frame(team = c('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'C', 'C' , 'CC'), position = c('G', 'G', 'F', 'G', 'F', 'F', 'F', 'G', 'G', 'F', 'F', 'F '), points = c(4, 13, 7, 8, 15, 15, 17, 9, 21, 22, 25, 31)) #view data frame df team position points 1 GA 4 2 AG 13 3AF 7 4 BG 8 5 BF 15 6 BF 15 7 BF 17 8 BG 9 9 GC 21 10 CF 22 11 CF 25 12 CF 31
Contoh 1: menghitung berdasarkan variabel
Kode berikut menunjukkan cara menghitung jumlah total pemain per tim:
library (dplyr)
#count total observations by variable 'team'
df %>% count(team)
# A tibble: 3 x 2
team n
1 to 3
2 B 5
3 C 4
Dari hasilnya kita dapat melihat bahwa:
- Tim A terdiri dari 3 pemain
- Tim B terdiri dari 5 pemain
- Tim C terdiri dari 4 pemain
Fungsi count() tunggal ini memberi kita gambaran bagus tentang distribusi pemain per tim.
Perhatikan bahwa kita juga dapat mengurutkan hitungan jika kita ingin:
#count total observations by variable 'team' df %>% count(team, sort= TRUE ) # A tibble: 3 x 2 team n 1 B 5 2 C 4 3 to 3
Contoh 2: Menghitung dengan beberapa variabel
Kita juga dapat mengurutkan berdasarkan beberapa variabel:
#count total observations by 'team' and 'position'
df %>% count(team, position)
# A tibble: 6 x 3
team position n
1 AF 1
2 AG 2
3 BF 3
4 BG 2
5 CF 3
6 GC 1
Dari hasilnya kita dapat melihat bahwa:
- Tim A mempunyai 1 pemain pada posisi “F” (depan) dan 2 pemain pada posisi “G” (penjaga).
- Tim B mempunyai 3 pemain pada posisi “F” (depan) dan 2 pemain pada posisi “G” (penjaga).
- Tim C mempunyai 3 pemain pada posisi “F” (depan) dan 1 pemain pada posisi “G” (penjaga).
Contoh 3: bilangan tertimbang
Kita juga dapat “membebani” jumlah satu variabel dengan variabel lainnya. Misalnya, kode berikut menunjukkan cara menghitung total observasi per tim, menggunakan variabel “poin” sebagai bobot:
df %>% count(team, wt= points )
# A tibble: 3 x 2
team n
1 to 24
2 B 64
3 C 99
Anda dapat menemukan dokumentasi lengkap untuk fungsi count() di sini .