Pandalar: özel karakterler sütundan nasıl kaldırılır


Pandas DataFrame’deki bir sütundan özel karakterleri kaldırmak için aşağıdaki temel sözdizimini kullanabilirsiniz:

 df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )

Bu özel örnek, sütunumdaki harf veya sayı olmayan tüm karakterleri kaldıracaktır.

Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.

Örnek: Pandalar’daki sütundan özel karakterleri kaldırın

Çeşitli basketbol oyuncuları hakkında bilgi içeren aşağıdaki pandalar DataFrame’e sahip olduğumuzu varsayalım:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs$ 12
1 Nets 15
2 Kings!! 22
3 Spurs% 29
4 &Heat& 24

Diyelim ki takım sütunu değerlerinden tüm özel karakterleri kaldırmak istiyoruz.

Bunu yapmak için aşağıdaki sözdizimini kullanabiliriz:

 #remove special characters from team column
df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Spurs 29
4 Heat 24

Takım sütunu değerlerinden tüm özel karakterlerin kaldırıldığını unutmayın.

Not : \W düzenli ifadesi, sözcük olmayan tüm karakterleri, yani alfabetik veya sayısal olmayan karakterleri aramak için kullanılır.

Bu örnekte, sözcük olmayan her karakteri boş bir değerle değiştirdik; bu, sözcük olmayan karakterleri kaldırmaya eşdeğerdir.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandalarda NaN değerleri sıfırlarla nasıl değiştirilir?
Pandalarda boş dizeler NaN ile nasıl değiştirilir?
Pandalar’da duruma göre sütundaki değerler nasıl değiştirilir?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir