Comment renommer des colonnes dans Pandas (avec exemples)



Vous pouvez utiliser l’une des trois méthodes suivantes pour renommer les colonnes d’un DataFrame pandas :

Méthode 1 : Renommer des colonnes spécifiques

df.rename(columns = {'old_col1':'new_col1', 'old_col2':'new_col2'}, inplace = True)

Méthode 2 : Renommer toutes les colonnes

df.columns = ['new_col1', 'new_col2', 'new_col3', 'new_col4']

Méthode 3 : remplacer des caractères spécifiques dans les colonnes

df.columns = df.columns.str.replace('old_char', 'new_char')

Les exemples suivants montrent comment utiliser chacune de ces méthodes dans la pratique.

Connexe : Comment obtenir les noms de colonnes dans Pandas (3 méthodes)

Méthode 1 : Renommer des colonnes spécifiques

Le code suivant montre comment renommer des colonnes spécifiques dans un DataFrame pandas :

import pandas as pd

#define DataFrame
df = pd.DataFrame({'team':['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   'points': [25, 12, 15, 14, 19, 23, 25, 29],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#list column names
list(df)

['team', 'points', 'assists', 'rebounds']

#rename specific column names
df.rename(columns = {'team':'team_name', 'points':'points_scored'}, inplace = True)

#view updated list of column names
list(df)

['team_name', 'points_scored', 'assists', 'rebounds']

Notez que les colonnes « équipe » et « points » ont été renommées tandis que tous les autres noms de colonnes sont restés les mêmes.

Méthode 2 : Renommer toutes les colonnes

Le code suivant montre comment renommer toutes les colonnes d’un DataFrame pandas :

import pandas as pd

#define DataFrame
df = pd.DataFrame({'team':['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   'points': [25, 12, 15, 14, 19, 23, 25, 29],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#list column names
list(df)

['team', 'points', 'assists', 'rebounds']

#rename all column names
df.columns = ['_team', '_points', '_assists', '_rebounds']

#view updated list of column names
list(df)

['_team', '_points', '_assists', '_rebounds']

Notez qu’il est plus rapide d’utiliser cette méthode lorsque vous souhaitez renommer la plupart ou la totalité des noms de colonnes du DataFrame.

Méthode 3 : remplacer des caractères spécifiques dans les colonnes

Le code suivant montre comment remplacer un caractère spécifique dans chaque nom de colonne :

import pandas as pd

#define DataFrame
df = pd.DataFrame({'$team':['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   '$points': [25, 12, 15, 14, 19, 23, 25, 29],
                   '$assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   '$rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#list column names
list(df)

['team', 'points', 'assists', 'rebounds']

#rename $ with blank in every column name
df.columns = df.columns.str.replace('$', '')

#view updated list of column names
list(df)

['team', 'points', 'assists', 'rebounds']

Notez que cette méthode nous a permis de supprimer rapidement le ‘$’ de chaque nom de colonne.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Comment répertorier tous les noms de colonnes dans Pandas
Comment trier les colonnes par nom dans Pandas
Comment supprimer les colonnes en double dans Pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *