Pandas: วิธีลบอักขระพิเศษออกจากคอลัมน์


คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อลบอักขระพิเศษออกจากคอลัมน์ใน DataFrame ของแพนด้า:

 df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )

ตัวอย่างนี้จะลบอักขระทั้งหมดออกจาก my_column ที่ไม่ใช่ตัวอักษรหรือตัวเลข

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ

ตัวอย่าง: ลบอักขระพิเศษออกจากคอลัมน์ใน Pandas

สมมติว่าเรามี DataFrame แพนด้าต่อไปนี้ซึ่งมีข้อมูลเกี่ยวกับผู้เล่นบาสเกตบอลต่างๆ:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs$ 12
1 Nets 15
2 Kings!! 22
3 Spurs% 29
4 &Heat& 24

สมมติว่าเราต้องการลบอักขระพิเศษทั้งหมดออกจากค่าคอลัมน์ ทีม

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อทำสิ่งนี้:

 #remove special characters from team column
df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Spurs 29
4 Heat 24

โปรดทราบว่าอักขระพิเศษทั้งหมดได้ถูกลบออกจากค่าคอลัมน์ ทีม แล้ว

หมายเหตุ : นิพจน์ทั่วไป \W ใช้เพื่อค้นหาอักขระที่ไม่ใช่คำทั้งหมด ซึ่งก็คืออักขระที่ไม่ใช่ทั้งตัวอักษรและตัวเลข

ในตัวอย่างนี้ เราได้แทนที่อักขระที่ไม่ใช่คำแต่ละตัวด้วยค่าว่าง ซึ่งเทียบเท่ากับการลบอักขระที่ไม่ใช่คำ

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีการทำงานทั่วไปอื่นๆ ในแพนด้า:

วิธีแทนที่ค่า NaN ด้วยศูนย์ใน Pandas
วิธีแทนที่สตริงว่างด้วย NaN ใน Pandas
วิธีแทนที่ค่าในคอลัมน์ตามเงื่อนไขใน Pandas

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *