Pandalar: özel karakterler sütundan nasıl kaldırılır
Pandas DataFrame’deki bir sütundan özel karakterleri kaldırmak için aşağıdaki temel sözdizimini kullanabilirsiniz:
df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )
Bu özel örnek, sütunumdaki harf veya sayı olmayan tüm karakterleri kaldıracaktır.
Aşağıdaki örnek, bu sözdiziminin pratikte nasıl kullanılacağını gösterir.
Örnek: Pandalar’daki sütundan özel karakterleri kaldırın
Çeşitli basketbol oyuncuları hakkında bilgi içeren aşağıdaki pandalar DataFrame’e sahip olduğumuzu varsayalım:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'], ' points ': [12, 15, 22, 29, 24]}) #view DataFrame print (df) team points 0 Mavs$ 12 1 Nets 15 2 Kings!! 22 3 Spurs% 29 4 &Heat& 24
Diyelim ki takım sütunu değerlerinden tüm özel karakterleri kaldırmak istiyoruz.
Bunu yapmak için aşağıdaki sözdizimini kullanabiliriz:
#remove special characters from team column df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True ) #view updated DataFrame print (df) team points 0 Mavs 12 1 Nets 15 2 Kings 22 3 Spurs 29 4 Heat 24
Takım sütunu değerlerinden tüm özel karakterlerin kaldırıldığını unutmayın.
Not : \W düzenli ifadesi, sözcük olmayan tüm karakterleri, yani alfabetik veya sayısal olmayan karakterleri aramak için kullanılır.
Bu örnekte, sözcük olmayan her karakteri boş bir değerle değiştirdik; bu, sözcük olmayan karakterleri kaldırmaya eşdeğerdir.
Ek kaynaklar
Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
Pandalarda NaN değerleri sıfırlarla nasıl değiştirilir?
Pandalarda boş dizeler NaN ile nasıl değiştirilir?
Pandalar’da duruma göre sütundaki değerler nasıl değiştirilir?