Comment compter le nombre d’occurrences dans les colonnes de R
Vous pouvez utiliser la syntaxe suivante dans R pour compter le nombre d’occurrences de certaines valeurs dans les colonnes d’un bloc de données :
#count number of occurrences of each value in column table(df$column_name) #count number of occurrences of each value (including NA values) in column table(df$column_name, useNA = 'always') #count number of occurrences of specific value length(which(df$column_name==value))
Les exemples suivants montrent comment utiliser cette syntaxe en pratique avec le bloc de données suivant :
#create data frame df <- data.frame(player=c('A', 'B', 'C', 'D', 'E', 'F'), team=c('Mavs', 'Mavs', 'Suns', 'Nets', 'Nets', 'Nets'), points=c(20, 22, 26, 30, 30, NA)) #view data frame df player team points 1 A Mavs 20 2 B Mavs 22 3 C Suns 26 4 D Nets 30 5 E Nets 30 6 F Nets NA
Exemple 1 : compter les occurrences de valeurs dans la colonne
Le code suivant montre comment compter le nombre d’occurrences de chaque valeur dans la colonne « équipe » :
#count number of occurrences of each team
table(df$team)
Mavs Nets Suns
2 3 1
Cela nous dit :
- Le nom de l’équipe « Mavs » apparaît 2 fois.
- Le nom de l’équipe « Nets » apparaît 3 fois.
- Le nom de l’équipe « Suns » apparaît 1 fois.
Exemple 2 : compter les occurrences de valeurs dans la colonne (y compris les valeurs NA)
Le code suivant montre comment compter le nombre d’occurrences de chaque valeur (y compris les valeurs NA) dans la colonne « points » :
#count number of occurrences of each value in 'points', including NA occurrences table(df$points, useNA = 'always') 20 22 26 30 <NA> 1 1 1 2 1
Cela nous dit :
- La valeur 20 apparaît 1 fois.
- La valeur 22 apparaît 1 fois.
- La valeur 26 apparaît 1 fois.
- La valeur 30 apparaît 2 fois.
- La valeur NA (valeur manquante) apparaît 1 fois.
Exemple 3 : Compter les occurrences d’une valeur spécifique dans la colonne
Le code suivant montre comment compter le nombre d’occurrences de la valeur 30 dans la colonne « points » :
#count number of occurrences of the value 30 in 'points' column length(which(df$points == 30)) [1] 2
Cela nous indique que la valeur 30 apparaît 2 fois dans la colonne ‘points’.
Vous pouvez également utiliser la syntaxe suivante pour compter le nombre d’occurrences de plusieurs valeurs différentes dans la colonne « points » :
#count number of occurrences of the value 30 or 26 in 'points' column length(which(df$points == 30 | df$points == 26)) [1] 3
Cela nous indique que la valeur 30 ou 26 apparaît au total 3 fois dans la colonne « points ».
Ressources additionnelles
Comment additionner des colonnes spécifiques dans R
Comment calculer la moyenne de plusieurs colonnes dans R
Comment trouver la valeur maximale sur plusieurs colonnes dans R