Як додати початкові нулі до рядків у pandas
Ви можете використовувати такий синтаксис, щоб додати початкові нулі до рядків у pandas DataFrame:
df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )
Ця конкретна формула додає стільки початкових нулів, скільки необхідно, до рядків у стовпці з позначкою «ID», доки кожен рядок не матиме довжину 7 .
Не соромтеся замінити 7 іншим значенням, щоб додати іншу кількість початкових нулів.
У наступному прикладі показано, як використовувати цей синтаксис на практиці.
Приклад: додайте початкові нулі до рядків у Pandas
Припустімо, у нас є наступний DataFrame pandas, який містить інформацію про розпродажі та відшкодування в різних магазинах:
import pandas as pd #createDataFrame df = pd. DataFrame ({' ID ': ['A25', 'B300', 'C6', 'D447289', 'E416', 'F19'], ' sales ': [18, 12, 27, 30, 45, 23], ' refunds ': [1, 3, 3, 2, 5, 0]}) #view DataFrame print (df) ID sales refunds 0 A25 18 1 1 B300 12 3 2 C6 27 3 3 D447289 30 2 4 E416 45 5 5 F19 23 0
Зауважте, що довжини рядків у стовпці “ID” не однакові.
Однак ми бачимо, що найдовший рядок складається з 7 символів.
Ми можемо використати такий синтаксис, щоб додати початкові нулі до рядків у стовпці «ID», щоб кожен рядок мав довжину 7 :
#add leading zeros to 'ID' column
df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )
#view updated DataFrame
print (df)
ID sales refunds
0 0000A25 18 1
1 000B300 12 3
2 00000C6 27 3
3 D447289 30 2
4 000E416 45 5
5 0000F19 23 0
Зауважте, що до рядків у стовпці «ID» додано початкові нулі, тому кожен рядок тепер має однакову довжину.
Примітка : Ви можете знайти повну документацію щодо функції застосування в pandas тут .
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:
Як призначити відсутні значення в пандах
Як порахувати пропущені значення в пандах
Як заповнити значення NaN середнім у pandas