Як додати початкові нулі до рядків у pandas


Ви можете використовувати такий синтаксис, щоб додати початкові нулі до рядків у pandas DataFrame:

 df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )

Ця конкретна формула додає стільки початкових нулів, скільки необхідно, до рядків у стовпці з позначкою «ID», доки кожен рядок не матиме довжину 7 .

Не соромтеся замінити 7 іншим значенням, щоб додати іншу кількість початкових нулів.

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: додайте початкові нулі до рядків у Pandas

Припустімо, у нас є наступний DataFrame pandas, який містить інформацію про розпродажі та відшкодування в різних магазинах:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' ID ': ['A25', 'B300', 'C6', 'D447289', 'E416', 'F19'],
                   ' sales ': [18, 12, 27, 30, 45, 23],
                   ' refunds ': [1, 3, 3, 2, 5, 0]})

#view DataFrame
print (df)

        ID sales refunds
0 A25 18 1
1 B300 12 3
2 C6 27 3
3 D447289 30 2
4 E416 45 5
5 F19 23 0

Зауважте, що довжини рядків у стовпці “ID” не однакові.

Однак ми бачимо, що найдовший рядок складається з 7 символів.

Ми можемо використати такий синтаксис, щоб додати початкові нулі до рядків у стовпці «ID», щоб кожен рядок мав довжину 7 :

 #add leading zeros to 'ID' column
df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )

#view updated DataFrame
print (df)

        ID sales refunds
0 0000A25 18 1
1 000B300 12 3
2 00000C6 27 3
3 D447289 30 2
4 000E416 45 5
5 0000F19 23 0

Зауважте, що до рядків у стовпці «ID» додано початкові нулі, тому кожен рядок тепер має однакову довжину.

Примітка : Ви можете знайти повну документацію щодо функції застосування в pandas тут .

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:

Як призначити відсутні значення в пандах
Як порахувати пропущені значення в пандах
Як заповнити значення NaN середнім у pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *