Comment exécuter une fonction COUNTIF en Python
Souvent, vous souhaiterez peut-être compter uniquement le nombre de lignes dans un DataFrame pandas qui répondent à certains critères.
Heureusement, cela est facile à faire en utilisant la syntaxe de base suivante :
sum(df.column_name == some_value)
Les exemples suivants montrent comment utiliser cette syntaxe en pratique sur le bloc de données suivant :
import pandas as pd
#create DataFrame
df = pd.DataFrame({'x': [3, 4, 5, 6, 7, 8, 9, 10, 10, 12, 13],
'y': [3, 4, 5, 7, 9, 13, 15, 19, 23, 24, 29]})
#view head of DataFrame
df.head()
x y
0 3 3
1 4 4
2 5 5
3 6 7
4 7 9
Exemple 1 : compter les lignes égales à une certaine valeur
Le code suivant montre comment compter le nombre de lignes où la variable x est égale à 10 :
sum(df.x == 10) 2
Le code suivant montre comment compter le nombre de lignes où la variable x est égale à 10 ou la variable y est égale à 5 :
sum((df.x == 10) | (df.y == 5)) 3
Le code suivant montre comment compter le nombre de lignes où la variable x n’est pas égale à 10 :
sum(df.x != 10) 9
Exemple 2 : compter des lignes supérieures ou égales à une certaine valeur
Le code suivant montre comment compter le nombre de lignes où x est supérieur à 10 :
sum(df.x > 10) 2
Le code suivant montre comment compter le nombre de lignes où x est inférieur ou égal à 7 :
sum(df.x <= 7) 5
Exemple 3 : Compter les lignes entre deux valeurs
Le code suivant montre comment compter le nombre de lignes où x est compris entre 10 et 20 :
sum((df.x >= 5) & (df.x <= 10)) 7
Ressources additionnelles
Pandas : comment trouver la différence entre deux lignes
Pandas : comment supprimer des lignes contenant une chaîne spécifique
Pandas : Comment supprimer les lignes en double dans un DataFrame