Pandas : comment vérifier si la colonne contient une chaîne



Vous pouvez utiliser les méthodes suivantes pour vérifier si une colonne d’un DataFrame pandas contient une chaîne :

Méthode 1 : vérifier si la chaîne exacte existe dans la colonne

(df['col'].eq('exact_string')).any()

Méthode 2 : vérifier si une chaîne partielle existe dans la colonne

df['col'].str.contains('partial_string').any()

Méthode 3 : compter les occurrences de chaîne partielle dans la colonne

df['col'].str.contains('partial_string').sum()

Ce tutoriel explique comment utiliser chaque méthode en pratique avec le DataFrame suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'B', 'B', 'C'],
                   'conference': ['East', 'East', 'South', 'West', 'West', 'East'],
                   'points': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team	conference   points
0	A	East         11
1	A	East	     8
2	A	South        10
3	B	West         6
4	B	West         6
5	C	East         5

Exemple 1 : Vérifier si la chaîne exacte existe dans la colonne

Le code suivant montre comment vérifier si la chaîne exacte « Eas » existe dans la colonne conférence du DataFrame :

#check if exact string 'Eas' exists in conference column
(df['conference'].eq('Eas')).any()

False

La sortie renvoie False , ce qui nous indique que la chaîne exacte « Eas » n’existe pas dans la colonne conférence du DataFrame.

Exemple 2 : Vérifier si une chaîne partielle existe dans la colonne

Le code suivant montre comment vérifier si la chaîne partielle « Eas » existe dans la colonne conférence du DataFrame :

#check if partial string 'Eas' exists in conference column
df['conference'].str.contains('Eas').any()

True

La sortie renvoie True , ce qui nous indique que la chaîne partielle « Eas » existe dans la colonne de conférence du DataFrame.

Exemple 3 : compter les occurrences d’une chaîne partielle dans une colonne

Le code suivant montre comment compter le nombre de fois où la chaîne partielle « Eas » apparaît dans la colonne de conférence du DataFrame :

#count occurrences of partial string 'Eas' in conference column
df['conference'].str.contains('East').sum()

3

La sortie renvoie 3 , ce qui nous indique que la chaîne partielle ‘Eas’ apparaît 3 fois dans la colonne conférence du DataFrame.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Comment supprimer des lignes dans Pandas DataFrame en fonction de la condition
Comment filtrer un DataFrame Pandas sur plusieurs conditions
Comment utiliser le filtre « NON IN » dans Pandas DataFrame

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *