Jak dodać zera wiodące do ciągów w pandach


Możesz użyć następującej składni, aby dodać zera początkowe do ciągów w ramce DataFrame pandy:

 df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )

Ta konkretna formuła dodaje tyle zer wiodących, ile potrzeba, do ciągów w kolumnie oznaczonej „ID”, aż każdy ciąg będzie miał długość 7 .

Możesz zastąpić 7 inną wartością, aby dodać inną liczbę zer wiodących.

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Dodaj zera wiodące do ciągów znaków w Pandach

Załóżmy, że mamy następującą ramkę DataFrame pand, która zawiera informacje o sprzedaży i zwrotach z różnych sklepów:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' ID ': ['A25', 'B300', 'C6', 'D447289', 'E416', 'F19'],
                   ' sales ': [18, 12, 27, 30, 45, 23],
                   ' refunds ': [1, 3, 3, 2, 5, 0]})

#view DataFrame
print (df)

        ID sales refunds
0 A25 18 1
1 B300 12 3
2 C6 27 3
3 D447289 30 2
4 E416 45 5
5 F19 23 0

Należy pamiętać, że długości ciągów w kolumnie „ID” nie są równe.

Widzimy jednak, że najdłuższy ciąg ma 7 znaków.

Możemy użyć następującej składni, aby dodać zera początkowe do ciągów w kolumnie „ID”, tak aby każdy ciąg miał długość 7 :

 #add leading zeros to 'ID' column
df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )

#view updated DataFrame
print (df)

        ID sales refunds
0 0000A25 18 1
1 000B300 12 3
2 00000C6 27 3
3 D447289 30 2
4 000E416 45 5
5 0000F19 23 0

Należy zauważyć, że do ciągów w kolumnie „ID” dodano zera początkowe, dzięki czemu każdy ciąg ma teraz tę samą długość.

Uwaga : Pełną dokumentację funkcji Apply w pandach znajdziesz tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Jak przypisać brakujące wartości w pandach
Jak policzyć brakujące wartości w pandach
Jak wypełnić wartości NaN średnią w pandach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *