Comment ajouter des zéros non significatifs aux chaînes dans Pandas
Vous pouvez utiliser la syntaxe suivante pour ajouter des zéros non significatifs aux chaînes dans un DataFrame pandas :
df['ID'] = df['ID'].apply('{:0>7}'.format)
Cette formule particulière ajoute autant de zéros non significatifs que nécessaire aux chaînes de la colonne intitulée « ID » jusqu’à ce que chaque chaîne ait une longueur de 7 .
N’hésitez pas à remplacer le 7 par une autre valeur pour ajouter un nombre différent de zéros non significatifs.
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : ajouter des zéros non significatifs aux chaînes dans Pandas
Supposons que nous ayons le DataFrame pandas suivant qui contient des informations sur les ventes et les remboursements de divers magasins :
import pandas as pd #create DataFrame df = pd.DataFrame({'ID': ['A25', 'B300', 'C6', 'D447289', 'E416', 'F19'], 'sales': [18, 12, 27, 30, 45, 23], 'refunds': [1, 3, 3, 2, 5, 0]}) #view DataFrame print(df) ID sales refunds 0 A25 18 1 1 B300 12 3 2 C6 27 3 3 D447289 30 2 4 E416 45 5 5 F19 23 0
Notez que les longueurs des chaînes dans la colonne « ID » ne sont pas toutes égales.
Cependant, nous pouvons voir que la chaîne la plus longue comporte 7 caractères.
Nous pouvons utiliser la syntaxe suivante pour ajouter des zéros non significatifs aux chaînes de la colonne ‘ID’ afin que chaque chaîne ait une longueur de 7 :
#add leading zeros to 'ID' column
df['ID'] = df['ID'].apply('{:0>7}'.format)
#view updated DataFrame
print(df)
ID sales refunds
0 0000A25 18 1
1 000B300 12 3
2 00000C6 27 3
3 D447289 30 2
4 000E416 45 5
5 0000F19 23 0
Notez que des zéros non significatifs ont été ajoutés aux chaînes dans la colonne « ID » afin que chaque chaîne ait désormais la même longueur.
Remarque : Vous pouvez trouver la documentation complète de la fonction apply dans pandas ici .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans les pandas :
Comment imputer les valeurs manquantes chez les pandas
Comment compter les valeurs manquantes chez les pandas
Comment remplir les valeurs NaN avec la moyenne chez les pandas