Come contare il numero di occorrenze nelle colonne in r


È possibile utilizzare la seguente sintassi in R per contare il numero di occorrenze di determinati valori nelle colonne di un frame di dati:

 #count number of occurrences of each value in column
table(df$column_name)

#count number of occurrences of each value (including NA values) in column
table(df$column_name, useNA = ' always ')

#count number of occurrences of specific value
length(which(df$column_name== value ))

I seguenti esempi mostrano come utilizzare in pratica questa sintassi con il seguente frame di dati:

 #create data frame
df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F'),
                 team=c('Mavs', 'Mavs', 'Suns', 'Nets', 'Nets', 'Nets'),
                 points=c(20, 22, 26, 30, 30, NA))

#view data frame
df

  player team points
1 A Mavs 20
2 B Mavs 22
3 C Suns 26
4 D Nets 30
5 E Nets 30
6 F Nets NA

Esempio 1: contare le occorrenze di valori nella colonna

Il codice seguente mostra come contare il numero di occorrenze di ciascun valore nella colonna “team”:

 #count number of occurrences of each team
table(df$team)

Mavs Nets Suns 
   2 3 1 

Questo ci dice:

  • Il nome della squadra “Mavs” appare 2 volte.
  • Il nome della squadra “Nets” appare 3 volte.
  • Il nome della squadra “Suns” appare 1 volta.

Esempio 2: conteggio delle occorrenze dei valori nella colonna (compresi i valori NA)

Il codice seguente mostra come contare il numero di occorrenze di ciascun valore (compresi i valori NA) nella colonna “punti”:

 #count number of occurrences of each value in 'points', including NA occurrences
table(df$points, useNA = ' always ')

  20 22 26 30 <NA>
   1 1 1 2 1

Questo ci dice:

  • Il valore 20 appare 1 volta.
  • Il valore 22 appare 1 volta.
  • Il valore 26 appare 1 volta.
  • Il valore 30 appare due volte.
  • Il valore NA (valore mancante) appare 1 volta.

Esempio 3: contare le occorrenze di un valore specifico nella colonna

Il codice seguente mostra come contare il numero di occorrenze del valore 30 nella colonna “punti”:

 #count number of occurrences of the value 30 in 'points' column
length(which(df$points == 30 ))

[1] 2

Questo ci dice che il valore 30 appare due volte nella colonna “punti”.

Puoi anche utilizzare la seguente sintassi per contare il numero di occorrenze di diversi valori nella colonna “punti”:

 #count number of occurrences of the value 30 or 26 in 'points' column
length(which(df$points == 30 | df$points == 26 ))

[1] 3

Questo ci dice che il valore 30 o 26 appare complessivamente 3 volte nella colonna “punti”.

Risorse addizionali

Come sommare colonne specifiche in R
Come calcolare la media di più colonne in R
Come trovare il valore massimo su più colonne in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *