A: cara mengelompokkan dan menghitung dengan syarat


Anda dapat menggunakan sintaks dasar berikut untuk melakukan kondisi pengelompokan dan penghitungan di R:

 library (dplyr)

df %>%
  group_by(var1) %>%
  summarize(count = sum(var2 == ' val '))

Sintaks khusus ini mengelompokkan baris-baris bingkai data berdasarkan var1 dan kemudian menghitung jumlah baris di mana var2 sama dengan “val”.

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: mengelompokkan dan menghitung dengan kondisi di R

Misalkan kita memiliki kerangka data berikut di R yang berisi informasi tentang berbagai pemain bola basket:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 pos=c('Gu', 'Fo', 'Fo', 'Fo', 'Gu', 'Gu', 'Fo', 'Fo'),
                 points=c(18, 22, 19, 14, 14, 11, 20, 28))


#view data frame
df

  team pos points
1 A Gu 18
2 A Fo 22
3 A Fo 19
4 A Fo 14
5 B Gu 14
6 B Gu 11
7 B Fo 20
8 B Fo 28

Kode berikut menunjukkan cara mengelompokkan bingkai data berdasarkan variabel tim dan menghitung jumlah baris dengan variabel pos sama dengan “Gu”:

 library (dplyr)

#group by team and count rows where pos is 'Gu'
df %>%
  group_by(team) %>%
  summarize(count = sum(pos == ' Gu '))

# A tibble: 2 x 2
  team count
   
1 to 1
2 B 2

Dari hasilnya kita dapat melihat:

  • Tim A mempunyai 1 baris yang kolom posnya sama dengan “Gu”
  • Tim B mempunyai 2 baris yang kolom posnya sama dengan “Gu”

Kita dapat menggunakan sintaks serupa untuk mengelompokkan dan menghitung dengan kondisi angka.

Misalnya, kode berikut menunjukkan cara mengelompokkan berdasarkan variabel tim dan menghitung jumlah baris yang variabel poinnya lebih besar dari 15:

 library (dplyr)

#group by team and count rows where pos is 'Gu'
df %>%
  group_by(team) %>%
  summarize(count = sum(points > 15 ))

# A tibble: 2 x 2
  team count
   
1 to 3
2 B 2

Dari hasilnya kita dapat melihat:

  • Tim A mempunyai 3 garis yang kolom poinnya lebih besar dari 15
  • Tim B mempunyai 2 garis yang kolom poinnya lebih besar dari 15

Anda dapat menggunakan sintaks serupa untuk mengelompokkan dan menghitung dengan kondisi spesifik apa pun yang Anda inginkan.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara menghitung nilai pada kolom dengan kondisi di R
Cara memilih N nilai pertama berdasarkan grup di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *