วิธีเพิ่มศูนย์นำหน้าให้กับสตริงใน pandas
คุณสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อเพิ่มศูนย์นำหน้าให้กับสตริงใน DataFrame ของแพนด้า:
df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )
สูตรเฉพาะนี้จะเพิ่มเลขศูนย์นำหน้าตามที่จำเป็นให้กับสตริงในคอลัมน์ชื่อ “ID” จนกว่าแต่ละสตริงจะมีความยาว 7
คุณสามารถแทนที่ 7 ด้วยค่าอื่นเพื่อเพิ่มเลขศูนย์นำหน้าจำนวนอื่นได้
ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ
ตัวอย่าง: เพิ่มศูนย์นำหน้าให้กับสตริงใน Pandas
สมมติว่าเรามี DataFrame แพนด้าต่อไปนี้ซึ่งมีข้อมูลเกี่ยวกับการขายและการคืนเงินจากร้านค้าต่างๆ:
import pandas as pd #createDataFrame df = pd. DataFrame ({' ID ': ['A25', 'B300', 'C6', 'D447289', 'E416', 'F19'], ' sales ': [18, 12, 27, 30, 45, 23], ' refunds ': [1, 3, 3, 2, 5, 0]}) #view DataFrame print (df) ID sales refunds 0 A25 18 1 1 B300 12 3 2 C6 27 3 3 D447289 30 2 4 E416 45 5 5 F19 23 0
โปรดทราบว่าความยาวของสตริงในคอลัมน์ “ID” นั้นไม่เท่ากันทั้งหมด
อย่างไรก็ตาม เราจะเห็นว่าสตริงที่ยาวที่สุดคือความยาว 7 อักขระ
เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อเพิ่มศูนย์นำหน้าให้กับสตริงในคอลัมน์ ‘ID’ เพื่อให้แต่ละสตริงมีความยาว 7 :
#add leading zeros to 'ID' column
df[' ID '] = df[' ID ']. apply (' {:0>7} '. format )
#view updated DataFrame
print (df)
ID sales refunds
0 0000A25 18 1
1 000B300 12 3
2 00000C6 27 3
3 D447289 30 2
4 000E416 45 5
5 0000F19 23 0
โปรดทราบว่ามีการเพิ่มศูนย์นำหน้าในสตริงในคอลัมน์ “ID” เพื่อให้แต่ละสตริงมีความยาวเท่ากัน
หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มของ Apply Function ใน Pandas ได้ที่นี่
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีการทำงานทั่วไปอื่นๆ ในแพนด้า:
วิธีใส่ค่าที่หายไปในแพนด้า
วิธีนับค่าที่หายไปในแพนด้า
วิธีเติมค่า NaN ด้วยค่าเฉลี่ยในหมีแพนด้า