Comment exécuter une fonction COUNTIF dans R
Souvent, vous souhaiterez peut-être compter uniquement le nombre de lignes dans un bloc de données R qui répondent à certains critères. Heureusement, cela est facile à faire en utilisant la syntaxe de base suivante :
sum(df$column == value, na.rm=TRUE)
Les exemples suivants montrent comment utiliser cette syntaxe en pratique sur le bloc de données suivant :
#create data frame data <- data.frame(team=c('Mavs', 'Mavs', 'Spurs', 'Spurs', 'Lakers'), points=c(14, NA, 8, 17, 22), rebounds=c(8, 5, 5, 9, 12)) #view data frame data team points rebounds 1 Mavs 14 8 2 Mavs NA 5 3 Spurs 8 5 4 Spurs 17 9 5 Lakers 22 12
Exemple 1 : compter les lignes égales à une certaine valeur
Le code suivant montre comment compter le nombre de lignes où le nom de l’équipe est égal à « Mavs » :
sum(data$team == 'Mavs')
[1] 2
Le code suivant montre comment compter le nombre de lignes où le nom de l’équipe est égal à « Mavs » ou « Lakers » :
sum(data$team == 'Mavs' | data$team == 'Lakers') [1] 3
Le code suivant montre comment compter le nombre de lignes où le nom de l’équipe n’est pas égal à « Lakers » :
sum(data$team != 'Lakers')
[1] 4
Exemple 2 : compter des lignes supérieures ou égales à une certaine valeur
Le code suivant montre comment compter le nombre de lignes où les points sont supérieurs à 10 :
sum(data$points > 10, na.rm=TRUE)
[1] 3
Le code suivant montre comment compter le nombre de lignes où les rebonds sont inférieurs ou égaux à 9 :
sum(data$rebounds <= 9, na.rm=TRUE)
[1] 4
Exemple 3 : Compter les lignes entre deux valeurs
Le code suivant montre comment compter le nombre de lignes où les points sont compris entre 10 et 20 :
sum(data$points > 10 & data$points < 20, na.rm=TRUE)
[1] 2
Le code suivant montre comment compter le nombre de lignes où les rebonds sont compris entre 8 et 10 :
sum(data$rebounds > 8 & data$rebounds < 10, na.rm=TRUE)
[1] 1
Ressources additionnelles
Comment compter les observations par groupe dans R
Comment regrouper et résumer des données dans R