Pandas: วิธีลบอักขระพิเศษออกจากคอลัมน์
คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อลบอักขระพิเศษออกจากคอลัมน์ใน DataFrame ของแพนด้า:
df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )
ตัวอย่างนี้จะลบอักขระทั้งหมดออกจาก my_column ที่ไม่ใช่ตัวอักษรหรือตัวเลข
ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ
ตัวอย่าง: ลบอักขระพิเศษออกจากคอลัมน์ใน Pandas
สมมติว่าเรามี DataFrame แพนด้าต่อไปนี้ซึ่งมีข้อมูลเกี่ยวกับผู้เล่นบาสเกตบอลต่างๆ:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'], ' points ': [12, 15, 22, 29, 24]}) #view DataFrame print (df) team points 0 Mavs$ 12 1 Nets 15 2 Kings!! 22 3 Spurs% 29 4 &Heat& 24
สมมติว่าเราต้องการลบอักขระพิเศษทั้งหมดออกจากค่าคอลัมน์ ทีม
เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อทำสิ่งนี้:
#remove special characters from team column df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True ) #view updated DataFrame print (df) team points 0 Mavs 12 1 Nets 15 2 Kings 22 3 Spurs 29 4 Heat 24
โปรดทราบว่าอักขระพิเศษทั้งหมดได้ถูกลบออกจากค่าคอลัมน์ ทีม แล้ว
หมายเหตุ : นิพจน์ทั่วไป \W ใช้เพื่อค้นหาอักขระที่ไม่ใช่คำทั้งหมด ซึ่งก็คืออักขระที่ไม่ใช่ทั้งตัวอักษรและตัวเลข
ในตัวอย่างนี้ เราได้แทนที่อักขระที่ไม่ใช่คำแต่ละตัวด้วยค่าว่าง ซึ่งเทียบเท่ากับการลบอักขระที่ไม่ใช่คำ
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีการทำงานทั่วไปอื่นๆ ในแพนด้า:
วิธีแทนที่ค่า NaN ด้วยศูนย์ใน Pandas
วิธีแทนที่สตริงว่างด้วย NaN ใน Pandas
วิธีแทนที่ค่าในคอลัมน์ตามเงื่อนไขใน Pandas