Come aggiungere zeri iniziali alle stringhe in pandas


È possibile utilizzare la seguente sintassi per aggiungere zeri iniziali alle stringhe in un DataFrame panda:

 df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )

Questa particolare formula aggiunge tutti gli zeri iniziali necessari alle stringhe nella colonna denominata “ID” finché ciascuna stringa non ha una lunghezza di 7 .

Sentiti libero di sostituire il 7 con un altro valore per aggiungere un numero diverso di zeri iniziali.

L’esempio seguente mostra come utilizzare questa sintassi nella pratica.

Esempio: aggiungere zeri iniziali alle stringhe in Panda

Supponiamo di avere il seguente DataFrame panda che contiene informazioni sulle vendite e sui rimborsi da vari negozi:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' ID ': ['A25', 'B300', 'C6', 'D447289', 'E416', 'F19'],
                   ' sales ': [18, 12, 27, 30, 45, 23],
                   ' refunds ': [1, 3, 3, 2, 5, 0]})

#view DataFrame
print (df)

        ID sales refunds
0 A25 18 1
1 B300 12 3
2 C6 27 3
3 D447289 30 2
4 E416 45 5
5 F19 23 0

Tieni presente che le lunghezze delle stringhe nella colonna “ID” non sono tutte uguali.

Tuttavia, possiamo vedere che la stringa più lunga è lunga 7 caratteri.

Possiamo usare la seguente sintassi per aggiungere zeri iniziali alle stringhe nella colonna ‘ID’ in modo che ogni stringa abbia una lunghezza di 7 :

 #add leading zeros to 'ID' column
df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )

#view updated DataFrame
print (df)

        ID sales refunds
0 0000A25 18 1
1 000B300 12 3
2 00000C6 27 3
3 D447289 30 2
4 000E416 45 5
5 0000F19 23 0

Tieni presente che sono stati aggiunti zeri iniziali alle stringhe nella colonna “ID” in modo che ogni stringa ora abbia la stessa lunghezza.

Nota : puoi trovare la documentazione completa della funzione di applicazione in panda qui .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:

Come imputare i valori mancanti nei panda
Come contare i valori mancanti nei panda
Come riempire i valori NaN con la media nei panda

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *