Pandas : Comment supprimer les espaces des colonnes



Vous pouvez utiliser les méthodes suivantes pour supprimer les espaces des colonnes dans un DataFrame pandas :

Méthode 1 : supprimer les espaces d’une colonne

df['my_column'] = df['my_column'].str.strip()

Méthode 2 : supprimer les espaces de toutes les colonnes de chaînes

df = df.apply(lambda x: x.str.strip() if x.dtype == 'object' else x)

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['Mavs', ' Heat', ' Nets ', 'Cavs', 'Hawks', 'Jazz '],
                   'position': ['Point Guard', ' Small Forward', 'Center  ',
                                'Power Forward', ' Point Guard ', 'Center'],
                   'points': [11, 8, 10, 6, 22, 29]})

#view DataFrame
print(df)

     team        position  points
0    Mavs     Point Guard      11
1    Heat   Small Forward       8
2   Nets         Center        10
3    Cavs   Power Forward       6
4   Hawks    Point Guard       22
5   Jazz           Center      29

Exemple 1 : Supprimer les espaces d’une colonne

Le code suivant montre comment supprimer les espaces de chaque chaîne de la colonne de position :

#strip whitespace from position column
df['position'] = df['position'].str.strip()

#view updated DataFrame
print(df)

     team       position  points
0    Mavs    Point Guard      11
1    Heat  Small Forward       8
2   Nets          Center      10
3    Cavs  Power Forward       6
4   Hawks    Point Guard      22
5   Jazz          Center      29

Notez que tous les espaces ont été supprimés de chaque chaîne comportant des espaces dans la colonne de position .

Exemple 2 : supprimer les espaces de toutes les colonnes de chaîne

Le code suivant montre comment supprimer les espaces de chaque chaîne dans toutes les colonnes de chaîne du DataFrame :

#strip whitespace from all string columns
df = df.apply(lambda x: x.str.strip() if x.dtype == 'object' else x)

#view updated DataFrame
print(df)

    team       position  points
0   Mavs    Point Guard      11
1   Heat  Small Forward       8
2   Nets         Center      10
3   Cavs  Power Forward       6
4  Hawks    Point Guard      22
5   Jazz         Center      29

Notez que tous les espaces ont été supprimés des colonnes team et position , qui sont les deux colonnes de chaîne du DataFrame.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Pandas : comment sélectionner des colonnes contenant une chaîne spécifique
Pandas : Comment filtrer les lignes en fonction de la longueur de la chaîne
Comment créer un DataFrame Pandas à partir d’une chaîne

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *