Hoe voorloopnullen aan tekenreeksen in panda's toe te voegen
U kunt de volgende syntaxis gebruiken om voorloopnullen toe te voegen aan tekenreeksen in een Panda DataFrame:
df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )
Deze specifieke formule voegt zoveel voorloopnullen toe als nodig is aan de tekenreeksen in de kolom met het label „ID“ totdat elke tekenreeks een lengte heeft van 7 .
Voel je vrij om de 7 te vervangen door een andere waarde om een ander aantal voorloopnullen toe te voegen.
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: Voeg voorloopnullen toe aan tekenreeksen in Panda’s
Laten we zeggen dat we het volgende Panda’s DataFrame hebben dat informatie bevat over verkopen en terugbetalingen van verschillende winkels:
import pandas as pd #createDataFrame df = pd. DataFrame ({' ID ': ['A25', 'B300', 'C6', 'D447289', 'E416', 'F19'], ' sales ': [18, 12, 27, 30, 45, 23], ' refunds ': [1, 3, 3, 2, 5, 0]}) #view DataFrame print (df) ID sales refunds 0 A25 18 1 1 B300 12 3 2 C6 27 3 3 D447289 30 2 4 E416 45 5 5 F19 23 0
Houd er rekening mee dat de lengtes van de tekenreeksen in de kolom „ID“ niet allemaal gelijk zijn.
We kunnen echter zien dat de langste reeks 7 tekens lang is.
We kunnen de volgende syntaxis gebruiken om voorloopnullen toe te voegen aan de tekenreeksen in de kolom ‚ID‘, zodat elke tekenreeks een lengte van 7 heeft:
#add leading zeros to 'ID' column
df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )
#view updated DataFrame
print (df)
ID sales refunds
0 0000A25 18 1
1 000B300 12 3
2 00000C6 27 3
3 D447289 30 2
4 000E416 45 5
5 0000F19 23 0
Merk op dat er voorloopnullen zijn toegevoegd aan de tekenreeksen in de kolom „ID“, zodat elke tekenreeks nu dezelfde lengte heeft.
Opmerking : u kunt hier de volledige documentatie van de toepassingsfunctie in panda’s vinden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:
Hoe ontbrekende waarden in panda’s toe te schrijven
Hoe ontbrekende waarden bij panda’s te tellen
Hoe NaN-waarden te vullen met gemiddelde in panda’s