Pandalar: belirli karakterler dizelerden nasıl kaldırılır
Pandas DataFrame’deki bir sütundaki dizelerden belirli karakterleri kaldırmak için aşağıdaki yöntemleri kullanabilirsiniz:
Yöntem 1: Dizelerden belirli karakterleri kaldırın
df[' my_column '] = df[' my_column ']. str . replace (' this_string ', '')
Yöntem 2: Dizelerdeki tüm harfleri kaldırın
df[' my_column '] = df[' my_column ']. str . replace (' \D ', '', regex= True )
Yöntem 3: Dizelerden tüm sayıları kaldırın
df[' my_column '] = df[' my_column ']. str . replace (' \d+ ', '', regex= True )
Aşağıdaki örnekler, her yöntemin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs2', 'Nets44', 'Kings33', 'Cavs90', 'Heat576'], ' points ': [12, 15, 22, 29, 24]}) #view DataFrame print (df) team points 0 Mavs2 12 1 Nets44 15 2 Kings33 22 3 Cavs90 29 4 Heat576 24
Örnek 1: Belirli karakterleri dizelerden kaldırın
Takım sütunundaki her dizeden “avs”yi kaldırmak için aşağıdaki sözdizimini kullanabiliriz:
#remove 'avs' from strings in team column df[' team '] = df[' team ']. str . replace (' avs ', '') #view updated DataFrame print (df) team points 0 M2 12 1 Nets44 15 2 Kings33 22 3 C90 29 4 Heat576 24
Takım sütununda “Mavs” ve “Cavs” içeren satırlardan “avs” ifadesinin kaldırıldığını unutmayın.
Örnek 2: Dizelerdeki tüm harfleri kaldırın
Takım sütunundaki her dizedeki tüm harfleri kaldırmak için aşağıdaki sözdizimini kullanabiliriz:
#remove letters from strings in team column df[' team '] = df[' team ']. str . replace (' \D ', '', regex= True ) #view updated DataFrame print (df) team points 0 2 12 1 44 15 2 33 22 3 90 29 4,576 24
Takım sütunundaki her dizedeki tüm harflerin kaldırıldığını unutmayın.
Geriye sadece sayısal değerler kalıyor.
Örnek 3: Dizelerdeki tüm sayıları kaldırın
Takım sütunundaki her dizedeki tüm sayıları kaldırmak için aşağıdaki sözdizimini kullanabiliriz:
#remove numbers from strings in team column df[' team '] = df[' team ']. str . replace (' \d+ ', '', regex= True ) #view updated DataFrame print (df) team points 0 Mavs 12 1 Nets 15 2 Kings 22 3 Cavs 29 4 Heat 24
Takım sütunundaki her dizedeki tüm sayıların kaldırıldığını unutmayın.
Geriye sadece harfler kaldı.
Ek kaynaklar
Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
Pandalarda NaN değerleri sıfırlarla nasıl değiştirilir?
Pandalarda boş dizeler NaN ile nasıl değiştirilir?
Pandalar’da duruma göre sütundaki değerler nasıl değiştirilir?