Hoe voorloopnullen aan tekenreeksen in panda's toe te voegen


U kunt de volgende syntaxis gebruiken om voorloopnullen toe te voegen aan tekenreeksen in een Panda DataFrame:

 df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )

Deze specifieke formule voegt zoveel voorloopnullen toe als nodig is aan de tekenreeksen in de kolom met het label „ID“ totdat elke tekenreeks een lengte heeft van 7 .

Voel je vrij om de 7 te vervangen door een andere waarde om een ander aantal voorloopnullen toe te voegen.

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: Voeg voorloopnullen toe aan tekenreeksen in Panda’s

Laten we zeggen dat we het volgende Panda’s DataFrame hebben dat informatie bevat over verkopen en terugbetalingen van verschillende winkels:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' ID ': ['A25', 'B300', 'C6', 'D447289', 'E416', 'F19'],
                   ' sales ': [18, 12, 27, 30, 45, 23],
                   ' refunds ': [1, 3, 3, 2, 5, 0]})

#view DataFrame
print (df)

        ID sales refunds
0 A25 18 1
1 B300 12 3
2 C6 27 3
3 D447289 30 2
4 E416 45 5
5 F19 23 0

Houd er rekening mee dat de lengtes van de tekenreeksen in de kolom „ID“ niet allemaal gelijk zijn.

We kunnen echter zien dat de langste reeks 7 tekens lang is.

We kunnen de volgende syntaxis gebruiken om voorloopnullen toe te voegen aan de tekenreeksen in de kolom ‚ID‘, zodat elke tekenreeks een lengte van 7 heeft:

 #add leading zeros to 'ID' column
df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )

#view updated DataFrame
print (df)

        ID sales refunds
0 0000A25 18 1
1 000B300 12 3
2 00000C6 27 3
3 D447289 30 2
4 000E416 45 5
5 0000F19 23 0

Merk op dat er voorloopnullen zijn toegevoegd aan de tekenreeksen in de kolom „ID“, zodat elke tekenreeks nu dezelfde lengte heeft.

Opmerking : u kunt hier de volledige documentatie van de toepassingsfunctie in panda’s vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Hoe ontbrekende waarden in panda’s toe te schrijven
Hoe ontbrekende waarden bij panda’s te tellen
Hoe NaN-waarden te vullen met gemiddelde in panda’s

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert