Cara menghitung jumlah kemunculan pada kolom di r


Anda dapat menggunakan sintaks berikut di R untuk menghitung jumlah kemunculan nilai tertentu di kolom bingkai data:

 #count number of occurrences of each value in column
table(df$column_name)

#count number of occurrences of each value (including NA values) in column
table(df$column_name, useNA = ' always ')

#count number of occurrences of specific value
length(which(df$column_name== value ))

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya dengan bingkai data berikut:

 #create data frame
df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F'),
                 team=c('Mavs', 'Mavs', 'Suns', 'Nets', 'Nets', 'Nets'),
                 points=c(20, 22, 26, 30, 30, NA))

#view data frame
df

  player team points
1 A Mavs 20
2 B Mavs 22
3 C Suns 26
4 D Nets 30
5 E Nets 30
6 F Nets NA

Contoh 1: Hitung kemunculan nilai pada kolom

Kode berikut menunjukkan cara menghitung jumlah kemunculan setiap nilai di kolom “tim”:

 #count number of occurrences of each team
table(df$team)

Mavs Nets Suns 
   2 3 1 

Ini memberitahu kita:

  • Nama tim “Mavs” muncul 2 kali.
  • Nama tim “Nets” muncul 3 kali.
  • Nama tim “Suns” muncul 1 kali.

Contoh 2: Menghitung kemunculan nilai pada kolom (termasuk nilai NA)

Kode berikut menunjukkan cara menghitung jumlah kemunculan setiap nilai (termasuk nilai NA) di kolom “poin”:

 #count number of occurrences of each value in 'points', including NA occurrences
table(df$points, useNA = ' always ')

  20 22 26 30 <NA>
   1 1 1 2 1

Ini memberitahu kita:

  • Nilai 20 muncul 1 kali.
  • Nilai 22 muncul 1 kali.
  • Nilai 26 muncul 1 kali.
  • Nilai 30 muncul dua kali.
  • Nilai NA (missing value) muncul 1 kali.

Contoh 3: Hitung kemunculan nilai tertentu di kolom

Kode berikut menunjukkan cara menghitung jumlah kemunculan nilai 30 pada kolom “poin”:

 #count number of occurrences of the value 30 in 'points' column
length(which(df$points == 30 ))

[1] 2

Ini memberitahu kita bahwa nilai 30 muncul dua kali di kolom ‘poin’.

Anda juga dapat menggunakan sintaks berikut untuk menghitung jumlah kemunculan beberapa nilai berbeda di kolom “poin”:

 #count number of occurrences of the value 30 or 26 in 'points' column
length(which(df$points == 30 | df$points == 26 ))

[1] 3

Ini memberitahu kita bahwa nilai 30 atau 26 muncul sebanyak 3 kali di kolom “poin”.

Sumber daya tambahan

Cara menjumlahkan kolom tertentu di R
Cara menghitung rata-rata beberapa kolom di R
Cara menemukan nilai maksimum di beberapa kolom di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *