Comment exécuter une fonction COUNTIF en Python



Souvent, vous souhaiterez peut-être compter uniquement le nombre de lignes dans un DataFrame pandas qui répondent à certains critères.

Heureusement, cela est facile à faire en utilisant la syntaxe de base suivante :

sum(df.column_name == some_value)

Les exemples suivants montrent comment utiliser cette syntaxe en pratique sur le bloc de données suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'x': [3, 4, 5, 6, 7, 8, 9, 10, 10, 12, 13],
                   'y': [3, 4, 5, 7, 9, 13, 15, 19, 23, 24, 29]})

#view head of DataFrame
df.head()

x	y
0	3	3
1	4	4
2	5	5
3	6	7
4	7	9

Exemple 1 : compter les lignes égales à une certaine valeur

Le code suivant montre comment compter le nombre de lignes où la variable x est égale à 10 :

sum(df.x == 10)

2

Le code suivant montre comment compter le nombre de lignes où la variable x est égale à 10 ou la variable y est égale à 5 :

sum((df.x == 10) | (df.y == 5))

3

Le code suivant montre comment compter le nombre de lignes où la variable x n’est pas égale à 10 :

sum(df.x != 10)

9

Exemple 2 : compter des lignes supérieures ou égales à une certaine valeur

Le code suivant montre comment compter le nombre de lignes où x est supérieur à 10 :

sum(df.x > 10) 

2

Le code suivant montre comment compter le nombre de lignes où x est inférieur ou égal à 7 :

sum(df.x <= 7)
 
5

Exemple 3 : Compter les lignes entre deux valeurs

Le code suivant montre comment compter le nombre de lignes où x est compris entre 10 et 20 :

sum((df.x >= 5) & (df.x <= 10))

7

Ressources additionnelles

Pandas : comment trouver la différence entre deux lignes
Pandas : comment supprimer des lignes contenant une chaîne spécifique
Pandas : Comment supprimer les lignes en double dans un DataFrame

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *