Pandas: cara menghapus karakter khusus dari kolom


Anda dapat menggunakan sintaks dasar berikut untuk menghapus karakter khusus dari kolom di pandas DataFrame:

 df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )

Contoh khusus ini akan menghapus semua karakter dari my_column yang bukan berupa huruf maupun angka.

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: menghapus karakter khusus dari kolom di Pandas

Misalkan kita memiliki pandas DataFrame berikut yang berisi informasi tentang berbagai pemain bola basket:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs$ 12
1 Nets 15
2 Kings!! 22
3 Spurs% 29
4 &Heat& 24

Katakanlah kita ingin menghapus semua karakter khusus dari nilai kolom tim .

Kita dapat menggunakan sintaks berikut untuk melakukan ini:

 #remove special characters from team column
df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Spurs 29
4 Heat 24

Perhatikan bahwa semua karakter khusus telah dihapus dari nilai kolom tim .

Catatan : Ekspresi reguler \W digunakan untuk mencari semua karakter non-kata, yaitu karakter yang bukan alfabet atau numerik.

Dalam contoh ini, kami mengganti setiap karakter non-kata dengan nilai kosong, yang setara dengan menghapus karakter non-kata.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:

Bagaimana cara mengganti nilai NaN dengan nol di Pandas
Bagaimana cara mengganti string kosong dengan NaN di Pandas
Cara mengganti nilai pada kolom berdasarkan kondisi di Pandas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *