Pandas : comment vérifier si la valeur existe dans la colonne



Vous pouvez utiliser les méthodes suivantes pour vérifier si une valeur particulière existe dans une colonne d’un DataFrame pandas :

Méthode 1 : vérifier s’il existe une valeur dans la colonne

22 in df['my_column'].values

Méthode 2 : vérifier si l’une des plusieurs valeurs existe dans la colonne

df['my_column'].isin([44, 45, 22]).any()

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   'points': [18, 22, 19, 14, 14, 11, 20, 28],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print(df)

  team  points  assists  rebounds
0    A      18        5        11
1    B      22        7         8
2    C      19        7        10
3    D      14        9         6
4    E      14       12         6
5    F      11        9         5
6    G      20        9         9
7    H      28        4        12

Exemple 1 : vérifier s’il existe une valeur dans la colonne

Le code suivant montre comment vérifier si la valeur 22 existe dans la colonne points :

#check if 22 exists in the 'points' column
22 in df['points'].values

True

La sortie renvoie True , ce qui nous indique que la valeur 22 existe dans la colonne des points .

Nous pouvons également utiliser la même syntaxe avec les colonnes de chaînes.

Par exemple, le code suivant montre comment vérifier si la chaîne « J » existe dans la colonne équipe :

#check if 'J' exists in the 'team' column
'J' in df['team'].values

False

La sortie renvoie False , ce qui nous indique que la chaîne « J » n’existe pas dans la colonne équipe .

Exemple 2 : Vérifier si l’une des plusieurs valeurs existe dans la colonne

Le code suivant montre comment vérifier si l’une des valeurs de la liste [44, 45, 22] existe dans la colonne des points :

#check if 44, 45 or 22 exist in the 'points' column
df['points'].isin([44, 45, 22]).any()

True

La sortie renvoie True , ce qui nous indique qu’au moins une des valeurs de la liste [44, 45, 22] existe dans la colonne points du DataFrame.

Nous pouvons également utiliser la même syntaxe avec les colonnes de chaînes.

Par exemple, le code suivant montre comment vérifier si une chaîne de la liste [‘J’, ‘K’, ‘L’] existe dans la colonne team :

#check if J, K, or L exists in the 'team' column
df['team'].isin(['J', 'K', 'L']).any() 
False

La sortie renvoie False , ce qui nous indique qu’aucune des chaînes de la liste n’existe dans la colonne team .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Comment supprimer des lignes dans Pandas DataFrame en fonction de la condition
Comment filtrer un DataFrame Pandas sur plusieurs conditions
Comment utiliser le filtre « NON IN » dans Pandas DataFrame

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *