Pandas: วิธีลบอักขระเฉพาะออกจากสตริง


คุณสามารถใช้วิธีการต่อไปนี้เพื่อลบอักขระเฉพาะออกจากสตริงในคอลัมน์ใน DataFrame ของแพนด้า:

วิธีที่ 1: ลบอักขระเฉพาะออกจากสตริง

 df[' my_column '] = df[' my_column ']. str . replace (' this_string ', '')

วิธีที่ 2: เอาตัวอักษรทั้งหมดออกจากสตริง

 df[' my_column '] = df[' my_column ']. str . replace (' \D ', '', regex= True )

วิธีที่ 3: เอาตัวเลขทั้งหมดออกจากสตริง

 df[' my_column '] = df[' my_column ']. str . replace (' \d+ ', '', regex= True )

ตัวอย่างต่อไปนี้แสดงวิธีการใช้แต่ละวิธีในทางปฏิบัติกับ Pandas DataFrame ต่อไปนี้:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs2', 'Nets44', 'Kings33', 'Cavs90', 'Heat576'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs2 12
1 Nets44 15
2 Kings33 22
3 Cavs90 29
4 Heat576 24

ตัวอย่างที่ 1: ลบอักขระเฉพาะออกจากสตริง

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อลบ “avs” ออกจากแต่ละสตริงในคอลัมน์ ทีม :

 #remove 'avs' from strings in team column
df[' team '] = df[' team ']. str . replace (' avs ', '')

#view updated DataFrame
print (df)

      team points
0 M2 12
1 Nets44 15
2 Kings33 22
3 C90 29
4 Heat576 24

โปรดทราบว่า “avs” ถูกลบออกจากแถวที่มี “Mavs” และ “Cavs” ในคอลัมน์ ทีม

ตัวอย่างที่ 2: ลบตัวอักษรทั้งหมดออกจากสตริง

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อลบตัวอักษรทั้งหมดออกจากแต่ละสตริงในคอลัมน์ ทีม :

 #remove letters from strings in team column
df[' team '] = df[' team ']. str . replace (' \D ', '', regex= True )

#view updated DataFrame
print (df)

  team points
0 2 12
1 44 15
2 33 22
3 90 29
4,576 24

โปรดทราบว่าตัวอักษรทั้งหมดได้ถูกลบออกจากแต่ละสายในคอลัมน์ ทีม แล้ว

เหลือเพียงค่าตัวเลขเท่านั้น

ตัวอย่างที่ 3: ลบตัวเลขทั้งหมดออกจากสตริง

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อลบตัวเลขทั้งหมดออกจากแต่ละสตริงในคอลัมน์ ทีม :

 #remove numbers from strings in team column
df[' team '] = df[' team ']. str . replace (' \d+ ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Cavs 29
4 Heat 24

โปรดทราบว่าหมายเลขทั้งหมดได้ถูกลบออกจากแต่ละสายในคอลัมน์ ทีม แล้ว

เหลือเพียงตัวอักษรเท่านั้น

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีการทำงานทั่วไปอื่นๆ ในแพนด้า:

วิธีแทนที่ค่า NaN ด้วยศูนย์ใน Pandas
วิธีแทนที่สตริงว่างด้วย NaN ใน Pandas
วิธีแทนที่ค่าในคอลัมน์ตามเงื่อนไขใน Pandas

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *