Pandas : Comment sélectionner des lignes qui ne commencent pas par une chaîne
Vous pouvez utiliser la syntaxe de base suivante pour sélectionner les lignes qui ne commencent pas par une chaîne spécifique dans un DataFrame pandas :
df[~df.my_column.str.startswith(('this', 'that'))]
Cette formule particulière sélectionne toutes les lignes du DataFrame où la colonne appelée my_column ne commence pas par la chaîne this ou la chaîne that .
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : sélectionnez les lignes qui ne commencent pas par une chaîne dans Pandas
Supposons que nous ayons le DataFrame pandas suivant qui contient des informations sur les ventes de divers magasins :
import pandas as pd #create DataFrame df = pd.DataFrame({'store': ['Upper East', 'Upper West', 'Lower East', 'West', 'CTR'], 'sales': [150, 224, 250, 198, 177]}) #view DataFrame print(df) store sales 0 Upper East 150 1 Upper West 224 2 Lower East 250 3 West 198 4 CTR 177
Nous pouvons utiliser la syntaxe suivante pour sélectionner toutes les lignes du DataFrame qui ne commencent pas par les chaînes « Upper » ou « Lower » dans la colonne du magasin :
#select all rows where store does not start with 'Upper' or 'Lower'
df[~df.store.str.startswith(('Upper', 'Lower'))]
store sales
3 West 198
4 CTR 177
Notez que les seules lignes renvoyées sont celles pour lesquelles la colonne du magasin ne commence pas par « Supérieur » ou « Lower ».
Si vous le souhaitez, vous pouvez également définir le tuple de chaînes en dehors de la fonction startupswith() :
#define tuple of strings
some_strings = ('Upper', 'Lower')
#select all rows where store does not start with strings in tuple
df[~df.store.str.startswith(some_strings)]
store sales
3 West 198
4 CTR 177
Cela produit le même résultat que la méthode précédente.
Remarque : Vous pouvez trouver la documentation complète de la fonction startwith dans pandas ici .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans les pandas :
Pandas : Comment filtrer les lignes en fonction de la longueur de la chaîne
Pandas : comment vérifier si la colonne contient une chaîne
Pandas : Comment concaténer des chaînes à l’aide de GroupBy