Pandalar: belirli karakterler dizelerden nasıl kaldırılır


Pandas DataFrame’deki bir sütundaki dizelerden belirli karakterleri kaldırmak için aşağıdaki yöntemleri kullanabilirsiniz:

Yöntem 1: Dizelerden belirli karakterleri kaldırın

 df[' my_column '] = df[' my_column ']. str . replace (' this_string ', '')

Yöntem 2: Dizelerdeki tüm harfleri kaldırın

 df[' my_column '] = df[' my_column ']. str . replace (' \D ', '', regex= True )

Yöntem 3: Dizelerden tüm sayıları kaldırın

 df[' my_column '] = df[' my_column ']. str . replace (' \d+ ', '', regex= True )

Aşağıdaki örnekler, her yöntemin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs2', 'Nets44', 'Kings33', 'Cavs90', 'Heat576'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs2 12
1 Nets44 15
2 Kings33 22
3 Cavs90 29
4 Heat576 24

Örnek 1: Belirli karakterleri dizelerden kaldırın

Takım sütunundaki her dizeden “avs”yi kaldırmak için aşağıdaki sözdizimini kullanabiliriz:

 #remove 'avs' from strings in team column
df[' team '] = df[' team ']. str . replace (' avs ', '')

#view updated DataFrame
print (df)

      team points
0 M2 12
1 Nets44 15
2 Kings33 22
3 C90 29
4 Heat576 24

Takım sütununda “Mavs” ve “Cavs” içeren satırlardan “avs” ifadesinin kaldırıldığını unutmayın.

Örnek 2: Dizelerdeki tüm harfleri kaldırın

Takım sütunundaki her dizedeki tüm harfleri kaldırmak için aşağıdaki sözdizimini kullanabiliriz:

 #remove letters from strings in team column
df[' team '] = df[' team ']. str . replace (' \D ', '', regex= True )

#view updated DataFrame
print (df)

  team points
0 2 12
1 44 15
2 33 22
3 90 29
4,576 24

Takım sütunundaki her dizedeki tüm harflerin kaldırıldığını unutmayın.

Geriye sadece sayısal değerler kalıyor.

Örnek 3: Dizelerdeki tüm sayıları kaldırın

Takım sütunundaki her dizedeki tüm sayıları kaldırmak için aşağıdaki sözdizimini kullanabiliriz:

 #remove numbers from strings in team column
df[' team '] = df[' team ']. str . replace (' \d+ ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Cavs 29
4 Heat 24

Takım sütunundaki her dizedeki tüm sayıların kaldırıldığını unutmayın.

Geriye sadece harfler kaldı.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandalarda NaN değerleri sıfırlarla nasıl değiştirilir?
Pandalarda boş dizeler NaN ile nasıl değiştirilir?
Pandalar’da duruma göre sütundaki değerler nasıl değiştirilir?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir