Pandas: як видалити певні символи з рядків
Ви можете використовувати такі методи, щоб видалити певні символи з рядків у стовпці в pandas DataFrame:
Спосіб 1. Видалення певних символів із рядків
df[' my_column '] = df[' my_column ']. str . replace (' this_string ', '')
Спосіб 2: Видаліть усі літери з рядків
df[' my_column '] = df[' my_column ']. str . replace (' \D ', '', regex= True )
Спосіб 3: Видаліть усі числа з рядків
df[' my_column '] = df[' my_column ']. str . replace (' \d+ ', '', regex= True )
Наступні приклади показують, як використовувати кожен метод на практиці з такими pandas DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs2', 'Nets44', 'Kings33', 'Cavs90', 'Heat576'], ' points ': [12, 15, 22, 29, 24]}) #view DataFrame print (df) team points 0 Mavs2 12 1 Nets44 15 2 Kings33 22 3 Cavs90 29 4 Heat576 24
Приклад 1: Видалення певних символів із рядків
Ми можемо використати такий синтаксис, щоб видалити «avs» із кожного рядка в стовпці team :
#remove 'avs' from strings in team column df[' team '] = df[' team ']. str . replace (' avs ', '') #view updated DataFrame print (df) team points 0 M2 12 1 Nets44 15 2 Kings33 22 3 C90 29 4 Heat576 24
Зауважте, що “avs” було видалено з рядків, які містять “Mavs” і “Cavs” у стовпці team .
Приклад 2: видалити всі літери з рядків
Ми можемо використати такий синтаксис, щоб видалити всі літери з кожного рядка в стовпці команди :
#remove letters from strings in team column df[' team '] = df[' team ']. str . replace (' \D ', '', regex= True ) #view updated DataFrame print (df) team points 0 2 12 1 44 15 2 33 22 3 90 29 4,576 24
Зауважте, що всі літери видалено з кожного рядка в стовпці команди .
Залишаються тільки числові значення.
Приклад 3: видалити всі числа з рядків
Ми можемо використати такий синтаксис, щоб видалити всі числа з кожного рядка в стовпці команди :
#remove numbers from strings in team column df[' team '] = df[' team ']. str . replace (' \d+ ', '', regex= True ) #view updated DataFrame print (df) team points 0 Mavs 12 1 Nets 15 2 Kings 22 3 Cavs 29 4 Heat 24
Зауважте, що всі числа були видалені з кожного рядка в стовпці команди .
Залишилися тільки букви.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:
Як замінити значення NaN на нулі в Pandas
Як замінити порожні рядки на NaN у Pandas
Як замінити значення в стовпці на основі умови в Pandas