Jak dodać zera wiodące do ciągów w pandach
Możesz użyć następującej składni, aby dodać zera początkowe do ciągów w ramce DataFrame pandy:
df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )
Ta konkretna formuła dodaje tyle zer wiodących, ile potrzeba, do ciągów w kolumnie oznaczonej „ID”, aż każdy ciąg będzie miał długość 7 .
Możesz zastąpić 7 inną wartością, aby dodać inną liczbę zer wiodących.
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Dodaj zera wiodące do ciągów znaków w Pandach
Załóżmy, że mamy następującą ramkę DataFrame pand, która zawiera informacje o sprzedaży i zwrotach z różnych sklepów:
import pandas as pd #createDataFrame df = pd. DataFrame ({' ID ': ['A25', 'B300', 'C6', 'D447289', 'E416', 'F19'], ' sales ': [18, 12, 27, 30, 45, 23], ' refunds ': [1, 3, 3, 2, 5, 0]}) #view DataFrame print (df) ID sales refunds 0 A25 18 1 1 B300 12 3 2 C6 27 3 3 D447289 30 2 4 E416 45 5 5 F19 23 0
Należy pamiętać, że długości ciągów w kolumnie „ID” nie są równe.
Widzimy jednak, że najdłuższy ciąg ma 7 znaków.
Możemy użyć następującej składni, aby dodać zera początkowe do ciągów w kolumnie „ID”, tak aby każdy ciąg miał długość 7 :
#add leading zeros to 'ID' column
df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )
#view updated DataFrame
print (df)
ID sales refunds
0 0000A25 18 1
1 000B300 12 3
2 00000C6 27 3
3 D447289 30 2
4 000E416 45 5
5 0000F19 23 0
Należy zauważyć, że do ciągów w kolumnie „ID” dodano zera początkowe, dzięki czemu każdy ciąg ma teraz tę samą długość.
Uwaga : Pełną dokumentację funkcji Apply w pandach znajdziesz tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:
Jak przypisać brakujące wartości w pandach
Jak policzyć brakujące wartości w pandach
Jak wypełnić wartości NaN średnią w pandach