Pandas : comment ajouter une chaîne à chaque valeur dans une colonne



Vous pouvez utiliser les méthodes suivantes pour ajouter une chaîne à chaque valeur dans une colonne d’un DataFrame pandas :

Méthode 1 : ajouter une chaîne à chaque valeur dans la colonne

df['my_column'] = 'some_string' + df['my_column'].astype(str)

Méthode 2 : ajouter une chaîne à chaque valeur dans la colonne en fonction de la condition

#define condition
mask = (df['my_column'] == 'A')

#add string to values in column equal to 'A'
df.loc[mask, 'my_column'] = 'some_string' + df['my_column'].astype(str)

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   'points': [18, 22, 19, 14, 14, 11, 20, 28],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print(df)

  team  points  assists  rebounds
0    A      18        5        11
1    A      22        7         8
2    A      19        7        10
3    A      14        9         6
4    B      14       12         6
5    B      11        9         5
6    B      20        9         9
7    B      28        4        12

Exemple 1 : ajouter une chaîne à chaque valeur dans la colonne

Le code suivant montre comment ajouter la chaîne « team_ » à chaque valeur de la colonne team :

#add string 'team_' to each value in team column
df['team'] = 'team_' + df['team'].astype(str)

#view updated DataFrame
print(df)

     team  points  assists  rebounds
0  team_A      18        5        11
1  team_B      22        7         8
2  team_C      19        7        10
3  team_D      14        9         6
4  team_E      14       12         6
5  team_F      11        9         5
6  team_G      20        9         9
7  team_H      28        4        12

Notez que le préfixe « team_ » a été ajouté à chaque valeur de la colonne équipe .

Vous pouvez également utiliser la syntaxe suivante pour ajouter « _team » comme suffixe à chaque valeur de la colonne équipe :

#add suffix 'team_' to each value in team column
df['team'] = df['team'].astype(str) + '_team'

#view updated DataFrame
print(df)

     team  points  assists  rebounds
0  A_team      18        5        11
1  A_team      22        7         8
2  A_team      19        7        10
3  A_team      14        9         6
4  B_team      14       12         6
5  B_team      11        9         5
6  B_team      20        9         9
7  B_team      28        4        12

Exemple 2 : ajouter une chaîne à chaque valeur dans une colonne en fonction de la condition

Le code suivant montre comment ajouter le préfixe « team_ » à chaque valeur de la colonne équipe où la valeur est égale à « A » :

#define condition
mask = (df['team'] == 'A')

#add string 'team_' to values that meet the condition
df.loc[mask, 'team'] = 'team_' + df['team'].astype(str)

#view updated DataFrame
print(df)

     team  points  assists  rebounds
0  team_A      18        5        11
1  team_A      22        7         8
2  team_A      19        7        10
3  team_A      14        9         6
4       B      14       12         6
5       B      11        9         5
6       B      20        9         9
7       B      28        4        12

Notez que le préfixe ‘team_’ n’a été ajouté qu’aux valeurs de la colonne équipe dont la valeur était égale à ‘A’.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Pandas : comment sélectionner des colonnes contenant une chaîne spécifique
Pandas : Comment sélectionner des lignes qui ne commencent pas par une chaîne
Pandas : comment vérifier si la colonne contient une chaîne

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *