Pandas : comment ajouter une chaîne à chaque valeur dans une colonne
Vous pouvez utiliser les méthodes suivantes pour ajouter une chaîne à chaque valeur dans une colonne d’un DataFrame pandas :
Méthode 1 : ajouter une chaîne à chaque valeur dans la colonne
df['my_column'] = 'some_string' + df['my_column'].astype(str)
Méthode 2 : ajouter une chaîne à chaque valeur dans la colonne en fonction de la condition
#define condition mask = (df['my_column'] == 'A') #add string to values in column equal to 'A' df.loc[mask, 'my_column'] = 'some_string' + df['my_column'].astype(str)
Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame pandas suivant :
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], 'points': [18, 22, 19, 14, 14, 11, 20, 28], 'assists': [5, 7, 7, 9, 12, 9, 9, 4], 'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print(df) team points assists rebounds 0 A 18 5 11 1 A 22 7 8 2 A 19 7 10 3 A 14 9 6 4 B 14 12 6 5 B 11 9 5 6 B 20 9 9 7 B 28 4 12
Exemple 1 : ajouter une chaîne à chaque valeur dans la colonne
Le code suivant montre comment ajouter la chaîne « team_ » à chaque valeur de la colonne team :
#add string 'team_' to each value in team column df['team'] = 'team_' + df['team'].astype(str) #view updated DataFrame print(df) team points assists rebounds 0 team_A 18 5 11 1 team_B 22 7 8 2 team_C 19 7 10 3 team_D 14 9 6 4 team_E 14 12 6 5 team_F 11 9 5 6 team_G 20 9 9 7 team_H 28 4 12
Notez que le préfixe « team_ » a été ajouté à chaque valeur de la colonne équipe .
Vous pouvez également utiliser la syntaxe suivante pour ajouter « _team » comme suffixe à chaque valeur de la colonne équipe :
#add suffix 'team_' to each value in team column df['team'] = df['team'].astype(str) + '_team' #view updated DataFrame print(df) team points assists rebounds 0 A_team 18 5 11 1 A_team 22 7 8 2 A_team 19 7 10 3 A_team 14 9 6 4 B_team 14 12 6 5 B_team 11 9 5 6 B_team 20 9 9 7 B_team 28 4 12
Exemple 2 : ajouter une chaîne à chaque valeur dans une colonne en fonction de la condition
Le code suivant montre comment ajouter le préfixe « team_ » à chaque valeur de la colonne équipe où la valeur est égale à « A » :
#define condition
mask = (df['team'] == 'A')
#add string 'team_' to values that meet the condition
df.loc[mask, 'team'] = 'team_' + df['team'].astype(str)
#view updated DataFrame
print(df)
team points assists rebounds
0 team_A 18 5 11
1 team_A 22 7 8
2 team_A 19 7 10
3 team_A 14 9 6
4 B 14 12 6
5 B 11 9 5
6 B 20 9 9
7 B 28 4 12
Notez que le préfixe ‘team_’ n’a été ajouté qu’aux valeurs de la colonne équipe dont la valeur était égale à ‘A’.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :
Pandas : comment sélectionner des colonnes contenant une chaîne spécifique
Pandas : Comment sélectionner des lignes qui ne commencent pas par une chaîne
Pandas : comment vérifier si la colonne contient une chaîne