Pandas: як видалити спеціальні символи зі стовпця


Ви можете використовувати наступний базовий синтаксис, щоб видалити спеціальні символи зі стовпця в pandas DataFrame:

 df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )

У цьому конкретному прикладі буде видалено всі символи з my_column , які не є ні літерами, ні цифрами.

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: видалити спеціальні символи зі стовпця в Pandas

Припустімо, що у нас є такий фрейм даних pandas, який містить інформацію про різних баскетболістів:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs$ 12
1 Nets 15
2 Kings!! 22
3 Spurs% 29
4 &Heat& 24

Припустімо, ми хочемо видалити всі спеціальні символи зі значень стовпця team .

Для цього ми можемо використати такий синтаксис:

 #remove special characters from team column
df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Spurs 29
4 Heat 24

Зауважте, що зі значень стовпця команди видалено всі спеціальні символи.

Примітка : Регулярний вираз \W використовується для пошуку всіх символів, які не є словами, тобто символів, які не є ні літерами, ні цифрами.

У цьому прикладі ми замінили кожен символ, який не є словом, порожнім значенням, що еквівалентно видаленню символів, які не є словом.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:

Як замінити значення NaN на нулі в Pandas
Як замінити порожні рядки на NaN у Pandas
Як замінити значення в стовпці на основі умови в Pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *