Come contare il numero di occorrenze nelle colonne in r
È possibile utilizzare la seguente sintassi in R per contare il numero di occorrenze di determinati valori nelle colonne di un frame di dati:
#count number of occurrences of each value in column table(df$column_name) #count number of occurrences of each value (including NA values) in column table(df$column_name, useNA = ' always ') #count number of occurrences of specific value length(which(df$column_name== value ))
I seguenti esempi mostrano come utilizzare in pratica questa sintassi con il seguente frame di dati:
#create data frame df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F'), team=c('Mavs', 'Mavs', 'Suns', 'Nets', 'Nets', 'Nets'), points=c(20, 22, 26, 30, 30, NA)) #view data frame df player team points 1 A Mavs 20 2 B Mavs 22 3 C Suns 26 4 D Nets 30 5 E Nets 30 6 F Nets NA
Esempio 1: contare le occorrenze di valori nella colonna
Il codice seguente mostra come contare il numero di occorrenze di ciascun valore nella colonna “team”:
#count number of occurrences of each team
table(df$team)
Mavs Nets Suns
2 3 1
Questo ci dice:
- Il nome della squadra “Mavs” appare 2 volte.
- Il nome della squadra “Nets” appare 3 volte.
- Il nome della squadra “Suns” appare 1 volta.
Esempio 2: conteggio delle occorrenze dei valori nella colonna (compresi i valori NA)
Il codice seguente mostra come contare il numero di occorrenze di ciascun valore (compresi i valori NA) nella colonna “punti”:
#count number of occurrences of each value in 'points', including NA occurrences table(df$points, useNA = ' always ') 20 22 26 30 <NA> 1 1 1 2 1
Questo ci dice:
- Il valore 20 appare 1 volta.
- Il valore 22 appare 1 volta.
- Il valore 26 appare 1 volta.
- Il valore 30 appare due volte.
- Il valore NA (valore mancante) appare 1 volta.
Esempio 3: contare le occorrenze di un valore specifico nella colonna
Il codice seguente mostra come contare il numero di occorrenze del valore 30 nella colonna “punti”:
#count number of occurrences of the value 30 in 'points' column length(which(df$points == 30 )) [1] 2
Questo ci dice che il valore 30 appare due volte nella colonna “punti”.
Puoi anche utilizzare la seguente sintassi per contare il numero di occorrenze di diversi valori nella colonna “punti”:
#count number of occurrences of the value 30 or 26 in 'points' column length(which(df$points == 30 | df$points == 26 )) [1] 3
Questo ci dice che il valore 30 o 26 appare complessivamente 3 volte nella colonna “punti”.
Risorse addizionali
Come sommare colonne specifiche in R
Come calcolare la media di più colonne in R
Come trovare il valore massimo su più colonne in R