Pandas : Comment sélectionner des lignes qui ne commencent pas par une chaîne



Vous pouvez utiliser la syntaxe de base suivante pour sélectionner les lignes qui ne commencent pas par une chaîne spécifique dans un DataFrame pandas :

df[~df.my_column.str.startswith(('this', 'that'))]

Cette formule particulière sélectionne toutes les lignes du DataFrame où la colonne appelée my_column ne commence pas par la chaîne this ou la chaîne that .

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : sélectionnez les lignes qui ne commencent pas par une chaîne dans Pandas

Supposons que nous ayons le DataFrame pandas suivant qui contient des informations sur les ventes de divers magasins :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'store': ['Upper East', 'Upper West', 'Lower East', 'West', 'CTR'],
                   'sales': [150, 224, 250, 198, 177]})

#view DataFrame
print(df)

        store  sales
0  Upper East    150
1  Upper West    224
2  Lower East    250
3        West    198
4         CTR    177     

Nous pouvons utiliser la syntaxe suivante pour sélectionner toutes les lignes du DataFrame qui ne commencent pas par les chaînes « Upper » ou « Lower » dans la colonne du magasin :

#select all rows where store does not start with 'Upper' or 'Lower'
df[~df.store.str.startswith(('Upper', 'Lower'))]

	store	sales
3	West	198
4	CTR	177

Notez que les seules lignes renvoyées sont celles pour lesquelles la colonne du magasin ne commence pas par « Supérieur » ou « Lower ».

Si vous le souhaitez, vous pouvez également définir le tuple de chaînes en dehors de la fonction startupswith() :

#define tuple of strings
some_strings = ('Upper', 'Lower')

#select all rows where store does not start with strings in tuple
df[~df.store.str.startswith(some_strings)]

	store	sales
3	West	198
4	CTR	177

Cela produit le même résultat que la méthode précédente.

Remarque : Vous pouvez trouver la documentation complète de la fonction startwith dans pandas ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans les pandas :

Pandas : Comment filtrer les lignes en fonction de la longueur de la chaîne
Pandas : comment vérifier si la colonne contient une chaîne
Pandas : Comment concaténer des chaînes à l’aide de GroupBy

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *