Pandas: як видалити певні символи з рядків


Ви можете використовувати такі методи, щоб видалити певні символи з рядків у стовпці в pandas DataFrame:

Спосіб 1. Видалення певних символів із рядків

 df[' my_column '] = df[' my_column ']. str . replace (' this_string ', '')

Спосіб 2: Видаліть усі літери з рядків

 df[' my_column '] = df[' my_column ']. str . replace (' \D ', '', regex= True )

Спосіб 3: Видаліть усі числа з рядків

 df[' my_column '] = df[' my_column ']. str . replace (' \d+ ', '', regex= True )

Наступні приклади показують, як використовувати кожен метод на практиці з такими pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs2', 'Nets44', 'Kings33', 'Cavs90', 'Heat576'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs2 12
1 Nets44 15
2 Kings33 22
3 Cavs90 29
4 Heat576 24

Приклад 1: Видалення певних символів із рядків

Ми можемо використати такий синтаксис, щоб видалити «avs» із кожного рядка в стовпці team :

 #remove 'avs' from strings in team column
df[' team '] = df[' team ']. str . replace (' avs ', '')

#view updated DataFrame
print (df)

      team points
0 M2 12
1 Nets44 15
2 Kings33 22
3 C90 29
4 Heat576 24

Зауважте, що “avs” було видалено з рядків, які містять “Mavs” і “Cavs” у стовпці team .

Приклад 2: видалити всі літери з рядків

Ми можемо використати такий синтаксис, щоб видалити всі літери з кожного рядка в стовпці команди :

 #remove letters from strings in team column
df[' team '] = df[' team ']. str . replace (' \D ', '', regex= True )

#view updated DataFrame
print (df)

  team points
0 2 12
1 44 15
2 33 22
3 90 29
4,576 24

Зауважте, що всі літери видалено з кожного рядка в стовпці команди .

Залишаються тільки числові значення.

Приклад 3: видалити всі числа з рядків

Ми можемо використати такий синтаксис, щоб видалити всі числа з кожного рядка в стовпці команди :

 #remove numbers from strings in team column
df[' team '] = df[' team ']. str . replace (' \d+ ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Cavs 29
4 Heat 24

Зауважте, що всі числа були видалені з кожного рядка в стовпці команди .

Залишилися тільки букви.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:

Як замінити значення NaN на нулі в Pandas
Як замінити порожні рядки на NaN у Pandas
Як замінити значення в стовпці на основі умови в Pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *