Comment compter le nombre d’occurrences dans les colonnes de R



Vous pouvez utiliser la syntaxe suivante dans R pour compter le nombre d’occurrences de certaines valeurs dans les colonnes d’un bloc de données :

#count number of occurrences of each value in column
table(df$column_name)

#count number of occurrences of each value (including NA values) in column
table(df$column_name, useNA = 'always')

#count number of occurrences of specific value
length(which(df$column_name==value))

Les exemples suivants montrent comment utiliser cette syntaxe en pratique avec le bloc de données suivant :

#create data frame
df <- data.frame(player=c('A', 'B', 'C', 'D', 'E', 'F'),
                 team=c('Mavs', 'Mavs', 'Suns', 'Nets', 'Nets', 'Nets'),
                 points=c(20, 22, 26, 30, 30, NA))

#view data frame
df

  player team points
1      A Mavs     20
2      B Mavs     22
3      C Suns     26
4      D Nets     30
5      E Nets     30
6      F Nets     NA

Exemple 1 : compter les occurrences de valeurs dans la colonne

Le code suivant montre comment compter le nombre d’occurrences de chaque valeur dans la colonne « équipe » :

#count number of occurrences of each team
table(df$team)

Mavs Nets Suns 
   2    3    1 

Cela nous dit :

  • Le nom de l’équipe « Mavs » apparaît 2 fois.
  • Le nom de l’équipe « Nets » apparaît 3 fois.
  • Le nom de l’équipe « Suns » apparaît 1 fois.

Exemple 2 : compter les occurrences de valeurs dans la colonne (y compris les valeurs NA)

Le code suivant montre comment compter le nombre d’occurrences de chaque valeur (y compris les valeurs NA) dans la colonne « points » :

#count number of occurrences of each value in 'points', including NA occurrences
table(df$points, useNA = 'always')

  20   22   26   30 <NA>
   1    1    1    2    1 

Cela nous dit :

  • La valeur 20 apparaît 1 fois.
  • La valeur 22 apparaît 1 fois.
  • La valeur 26 apparaît 1 fois.
  • La valeur 30 apparaît 2 fois.
  • La valeur NA (valeur manquante) apparaît 1 fois.

Exemple 3 : Compter les occurrences d’une valeur spécifique dans la colonne

Le code suivant montre comment compter le nombre d’occurrences de la valeur 30 dans la colonne « points » :

#count number of occurrences of the value 30 in 'points' column
length(which(df$points == 30))

[1] 2

Cela nous indique que la valeur 30 apparaît 2 fois dans la colonne ‘points’.

Vous pouvez également utiliser la syntaxe suivante pour compter le nombre d’occurrences de plusieurs valeurs différentes dans la colonne « points » :

#count number of occurrences of the value 30 or 26 in 'points' column
length(which(df$points == 30 | df$points == 26))

[1] 3

Cela nous indique que la valeur 30 ou 26 apparaît au total 3 fois dans la colonne « points ».

Ressources additionnelles

Comment additionner des colonnes spécifiques dans R
Comment calculer la moyenne de plusieurs colonnes dans R
Comment trouver la valeur maximale sur plusieurs colonnes dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *