Comment filtrer un DataFrame Pandas sur plusieurs conditions



Souvent, vous souhaiterez peut-être filtrer un DataFrame pandas sur plusieurs conditions. Heureusement, cela est facile à faire en utilisant des opérations booléennes.

Ce didacticiel fournit plusieurs exemples sur la façon de filtrer le DataFrame pandas suivant sur plusieurs conditions :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'B', 'B', 'C'],
                   'points': [25, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 9, 12],
                   'rebounds': [11, 8, 10, 6, 6]})

#view DataFrame 
df

        team	points	assists	rebounds
0	A	25	5	11
1	A	12	7	8
2	B	15	7	10
3	B	14	9	6
4	C	19	12	6

Exemple 1 : filtrer sur plusieurs conditions à l’aide de « Et »

Le code suivant illustre comment filtrer le DataFrame à l’aide de l’opérateur et ( & ) :

#return only rows where points is greater than 13 and assists is greater than 7
df[(df.points > 13) & (df.assists > 7)]

        team	points	assists	rebounds
3	B	14	9	6
4	C	19	12	6

#return only rows where team is 'A' and points is greater than or equal to 15
df[(df.team == 'A') & (df.points >= 15)]


        team	points	assists	rebounds
0	A	25	5	11

Exemple 2 : Filtrer sur plusieurs conditions à l’aide de « Ou »

Le code suivant illustre comment filtrer le DataFrame à l’aide de l’opérateur ou ( | ) :

#return only rows where points is greater than 13 or assists is greater than 7
df[(df.points > 13) | (df.assists > 7)]


        team	points	assists	rebounds
0	A	25	5	11
2	B	15	7	10
3	B	14	9	6
4	C	19	12	6

#return only rows where team is 'A' or points is greater than or equal to 15
df[(df.team == 'A') | (df.points >= 15)]

        team	points	assists	rebounds
0	A	25	5	11
1	A	12	7	8
2	B	15	7	10
4	C	19	12	6

Exemple 3 : filtrer sur plusieurs conditions à l’aide d’une liste

Le code suivant illustre comment filtrer le DataFrame où les valeurs de ligne se trouvent dans une liste.

#define a list of values
filter_list = [12, 14, 15]

#return only rows where points is in the list of values
df[df.points.isin(filter_list)]

	team	points	assists	rebounds
1	A	12	7	8
2	B	15	7	10
3	B	14	9	6

#define another list of values
filter_list2 = ['A', 'C']

#return only rows where team is in the list of values
df[df.team.isin(filter_list2)]


        team	points	assists	rebounds
0	A	25	5	11
1	A	12	7	8
4	C	19	12	6

Vous pouvez trouver plus de tutoriels sur les pandas ici .

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *