Pandas : comment vérifier si la colonne contient une chaîne
Vous pouvez utiliser les méthodes suivantes pour vérifier si une colonne d’un DataFrame pandas contient une chaîne :
Méthode 1 : vérifier si la chaîne exacte existe dans la colonne
(df['col'].eq('exact_string')).any()
Méthode 2 : vérifier si une chaîne partielle existe dans la colonne
df['col'].str.contains('partial_string').any()
Méthode 3 : compter les occurrences de chaîne partielle dans la colonne
df['col'].str.contains('partial_string').sum()
Ce tutoriel explique comment utiliser chaque méthode en pratique avec le DataFrame suivant :
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'A', 'A', 'B', 'B', 'C'], 'conference': ['East', 'East', 'South', 'West', 'West', 'East'], 'points': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A South 10 3 B West 6 4 B West 6 5 C East 5
Exemple 1 : Vérifier si la chaîne exacte existe dans la colonne
Le code suivant montre comment vérifier si la chaîne exacte « Eas » existe dans la colonne conférence du DataFrame :
#check if exact string 'Eas' exists in conference column (df['conference'].eq('Eas')).any() False
La sortie renvoie False , ce qui nous indique que la chaîne exacte « Eas » n’existe pas dans la colonne conférence du DataFrame.
Exemple 2 : Vérifier si une chaîne partielle existe dans la colonne
Le code suivant montre comment vérifier si la chaîne partielle « Eas » existe dans la colonne conférence du DataFrame :
#check if partial string 'Eas' exists in conference column df['conference'].str.contains('Eas').any() True
La sortie renvoie True , ce qui nous indique que la chaîne partielle « Eas » existe dans la colonne de conférence du DataFrame.
Exemple 3 : compter les occurrences d’une chaîne partielle dans une colonne
Le code suivant montre comment compter le nombre de fois où la chaîne partielle « Eas » apparaît dans la colonne de conférence du DataFrame :
#count occurrences of partial string 'Eas' in conference column df['conference'].str.contains('East').sum() 3
La sortie renvoie 3 , ce qui nous indique que la chaîne partielle ‘Eas’ apparaît 3 fois dans la colonne conférence du DataFrame.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :
Comment supprimer des lignes dans Pandas DataFrame en fonction de la condition
Comment filtrer un DataFrame Pandas sur plusieurs conditions
Comment utiliser le filtre « NON IN » dans Pandas DataFrame