Comment filtrer un DataFrame Pandas sur plusieurs conditions
Souvent, vous souhaiterez peut-être filtrer un DataFrame pandas sur plusieurs conditions. Heureusement, cela est facile à faire en utilisant des opérations booléennes.
Ce didacticiel fournit plusieurs exemples sur la façon de filtrer le DataFrame pandas suivant sur plusieurs conditions :
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'A', 'B', 'B', 'C'], 'points': [25, 12, 15, 14, 19], 'assists': [5, 7, 7, 9, 12], 'rebounds': [11, 8, 10, 6, 6]}) #view DataFrame df team points assists rebounds 0 A 25 5 11 1 A 12 7 8 2 B 15 7 10 3 B 14 9 6 4 C 19 12 6
Exemple 1 : filtrer sur plusieurs conditions à l’aide de « Et »
Le code suivant illustre comment filtrer le DataFrame à l’aide de l’opérateur et ( & ) :
#return only rows where points is greater than 13 and assists is greater than 7 df[(df.points > 13) & (df.assists > 7)] team points assists rebounds 3 B 14 9 6 4 C 19 12 6 #return only rows where team is 'A' and points is greater than or equal to 15 df[(df.team == 'A') & (df.points >= 15)] team points assists rebounds 0 A 25 5 11
Exemple 2 : Filtrer sur plusieurs conditions à l’aide de « Ou »
Le code suivant illustre comment filtrer le DataFrame à l’aide de l’opérateur ou ( | ) :
#return only rows where points is greater than 13 or assists is greater than 7 df[(df.points > 13) | (df.assists > 7)] team points assists rebounds 0 A 25 5 11 2 B 15 7 10 3 B 14 9 6 4 C 19 12 6 #return only rows where team is 'A' or points is greater than or equal to 15 df[(df.team == 'A') | (df.points >= 15)] team points assists rebounds 0 A 25 5 11 1 A 12 7 8 2 B 15 7 10 4 C 19 12 6
Exemple 3 : filtrer sur plusieurs conditions à l’aide d’une liste
Le code suivant illustre comment filtrer le DataFrame où les valeurs de ligne se trouvent dans une liste.
#define a list of values filter_list = [12, 14, 15] #return only rows where points is in the list of values df[df.points.isin(filter_list)] team points assists rebounds 1 A 12 7 8 2 B 15 7 10 3 B 14 9 6 #define another list of values filter_list2 = ['A', 'C'] #return only rows where team is in the list of values df[df.team.isin(filter_list2)] team points assists rebounds 0 A 25 5 11 1 A 12 7 8 4 C 19 12 6
Vous pouvez trouver plus de tutoriels sur les pandas ici .