Pandas: cara menghapus karakter khusus dari kolom
Anda dapat menggunakan sintaks dasar berikut untuk menghapus karakter khusus dari kolom di pandas DataFrame:
df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )
Contoh khusus ini akan menghapus semua karakter dari my_column yang bukan berupa huruf maupun angka.
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh: menghapus karakter khusus dari kolom di Pandas
Misalkan kita memiliki pandas DataFrame berikut yang berisi informasi tentang berbagai pemain bola basket:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'], ' points ': [12, 15, 22, 29, 24]}) #view DataFrame print (df) team points 0 Mavs$ 12 1 Nets 15 2 Kings!! 22 3 Spurs% 29 4 &Heat& 24
Katakanlah kita ingin menghapus semua karakter khusus dari nilai kolom tim .
Kita dapat menggunakan sintaks berikut untuk melakukan ini:
#remove special characters from team column df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True ) #view updated DataFrame print (df) team points 0 Mavs 12 1 Nets 15 2 Kings 22 3 Spurs 29 4 Heat 24
Perhatikan bahwa semua karakter khusus telah dihapus dari nilai kolom tim .
Catatan : Ekspresi reguler \W digunakan untuk mencari semua karakter non-kata, yaitu karakter yang bukan alfabet atau numerik.
Dalam contoh ini, kami mengganti setiap karakter non-kata dengan nilai kosong, yang setara dengan menghapus karakter non-kata.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:
Bagaimana cara mengganti nilai NaN dengan nol di Pandas
Bagaimana cara mengganti string kosong dengan NaN di Pandas
Cara mengganti nilai pada kolom berdasarkan kondisi di Pandas