Comment renommer des colonnes dans Pandas (avec exemples)
Vous pouvez utiliser l’une des trois méthodes suivantes pour renommer les colonnes d’un DataFrame pandas :
Méthode 1 : Renommer des colonnes spécifiques
df.rename(columns = {'old_col1':'new_col1', 'old_col2':'new_col2'}, inplace = True)
Méthode 2 : Renommer toutes les colonnes
df.columns = ['new_col1', 'new_col2', 'new_col3', 'new_col4']
Méthode 3 : remplacer des caractères spécifiques dans les colonnes
df.columns = df.columns.str.replace('old_char', 'new_char')
Les exemples suivants montrent comment utiliser chacune de ces méthodes dans la pratique.
Connexe : Comment obtenir les noms de colonnes dans Pandas (3 méthodes)
Méthode 1 : Renommer des colonnes spécifiques
Le code suivant montre comment renommer des colonnes spécifiques dans un DataFrame pandas :
import pandas as pd #define DataFrame df = pd.DataFrame({'team':['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], 'points': [25, 12, 15, 14, 19, 23, 25, 29], 'assists': [5, 7, 7, 9, 12, 9, 9, 4], 'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]}) #list column names list(df) ['team', 'points', 'assists', 'rebounds'] #rename specific column names df.rename(columns = {'team':'team_name', 'points':'points_scored'}, inplace = True) #view updated list of column names list(df) ['team_name', 'points_scored', 'assists', 'rebounds']
Notez que les colonnes « équipe » et « points » ont été renommées tandis que tous les autres noms de colonnes sont restés les mêmes.
Méthode 2 : Renommer toutes les colonnes
Le code suivant montre comment renommer toutes les colonnes d’un DataFrame pandas :
import pandas as pd #define DataFrame df = pd.DataFrame({'team':['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], 'points': [25, 12, 15, 14, 19, 23, 25, 29], 'assists': [5, 7, 7, 9, 12, 9, 9, 4], 'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]}) #list column names list(df) ['team', 'points', 'assists', 'rebounds'] #rename all column names df.columns = ['_team', '_points', '_assists', '_rebounds'] #view updated list of column names list(df) ['_team', '_points', '_assists', '_rebounds']
Notez qu’il est plus rapide d’utiliser cette méthode lorsque vous souhaitez renommer la plupart ou la totalité des noms de colonnes du DataFrame.
Méthode 3 : remplacer des caractères spécifiques dans les colonnes
Le code suivant montre comment remplacer un caractère spécifique dans chaque nom de colonne :
import pandas as pd #define DataFrame df = pd.DataFrame({'$team':['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], '$points': [25, 12, 15, 14, 19, 23, 25, 29], '$assists': [5, 7, 7, 9, 12, 9, 9, 4], '$rebounds': [11, 8, 10, 6, 6, 5, 9, 12]}) #list column names list(df) ['team', 'points', 'assists', 'rebounds'] #rename $ with blank in every column name df.columns = df.columns.str.replace('$', '') #view updated list of column names list(df) ['team', 'points', 'assists', 'rebounds']
Notez que cette méthode nous a permis de supprimer rapidement le ‘$’ de chaque nom de colonne.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :
Comment répertorier tous les noms de colonnes dans Pandas
Comment trier les colonnes par nom dans Pandas
Comment supprimer les colonnes en double dans Pandas