Cara menghitung observasi per kelompok di r


Seringkali Anda mungkin tertarik untuk menghitung jumlah observasi per grup di R.

Untungnya, hal ini mudah dilakukan dengan menggunakan fungsi count() pada perpustakaan dplyr .

Tutorial ini menjelaskan beberapa contoh penggunaan praktis fungsi ini menggunakan bingkai data berikut:

 #create data frame
df <- data.frame(team = c('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'C', 'C' , 'CC'),
                 position = c('G', 'G', 'F', 'G', 'F', 'F', 'F', 'G', 'G', 'F', 'F', 'F '),
                 points = c(4, 13, 7, 8, 15, 15, 17, 9, 21, 22, 25, 31))

#view data frame
df

   team position points
1 GA 4
2 AG 13
3AF 7
4 BG 8
5 BF 15
6 BF 15
7 BF 17
8 BG 9
9 GC 21
10 CF 22
11 CF 25
12 CF 31

Contoh 1: menghitung berdasarkan variabel

Kode berikut menunjukkan cara menghitung jumlah total pemain per tim:

 library (dplyr)

#count total observations by variable 'team'
df %>% count(team)

# A tibble: 3 x 2
  team n
   
1 to 3
2 B 5
3 C 4

Dari hasilnya kita dapat melihat bahwa:

  • Tim A terdiri dari 3 pemain
  • Tim B terdiri dari 5 pemain
  • Tim C terdiri dari 4 pemain

Fungsi count() tunggal ini memberi kita gambaran bagus tentang distribusi pemain per tim.

Perhatikan bahwa kita juga dapat mengurutkan hitungan jika kita ingin:

 #count total observations by variable 'team'
df %>% count(team, sort= TRUE )

# A tibble: 3 x 2
  team n
   
1 B 5
2 C 4
3 to 3

Contoh 2: Menghitung dengan beberapa variabel

Kita juga dapat mengurutkan berdasarkan beberapa variabel:

 #count total observations by 'team' and 'position'
df %>% count(team, position)

# A tibble: 6 x 3
  team position n
       
1 AF 1
2 AG 2
3 BF 3
4 BG 2
5 CF 3
6 GC 1

Dari hasilnya kita dapat melihat bahwa:

  • Tim A mempunyai 1 pemain pada posisi “F” (depan) dan 2 pemain pada posisi “G” (penjaga).
  • Tim B mempunyai 3 pemain pada posisi “F” (depan) dan 2 pemain pada posisi “G” (penjaga).
  • Tim C mempunyai 3 pemain pada posisi “F” (depan) dan 1 pemain pada posisi “G” (penjaga).

Contoh 3: bilangan tertimbang

Kita juga dapat “membebani” jumlah satu variabel dengan variabel lainnya. Misalnya, kode berikut menunjukkan cara menghitung total observasi per tim, menggunakan variabel “poin” sebagai bobot:

 df %>% count(team, wt= points )

# A tibble: 3 x 2
  team n
   
1 to 24
2 B 64
3 C 99

Anda dapat menemukan dokumentasi lengkap untuk fungsi count() di sini .

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *