Pandy: jak usunąć znaki specjalne z kolumny


Aby usunąć znaki specjalne z kolumny w ramce DataFrame pandy, możesz użyć następującej podstawowej składni:

 df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )

Ten konkretny przykład usunie wszystkie znaki z my_column , które nie są ani literami, ani cyframi.

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: usuń znaki specjalne z kolumny w Pandach

Załóżmy, że mamy następującą ramkę danych pand, która zawiera informacje o różnych koszykarzach:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs$ 12
1 Nets 15
2 Kings!! 22
3 Spurs% 29
4 &Heat& 24

Załóżmy, że chcemy usunąć wszystkie znaki specjalne z wartości kolumn zespołu .

W tym celu możemy użyć następującej składni:

 #remove special characters from team column
df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Spurs 29
4 Heat 24

Należy pamiętać, że wszystkie znaki specjalne zostały usunięte z wartości kolumn zespołu .

Uwaga : Wyrażenie regularne \W służy do wyszukiwania wszystkich znaków niebędących wyrazami, czyli znaków, które nie są ani alfabetyczne, ani numeryczne.

W tym przykładzie zastąpiliśmy każdy znak niebędący wyrazem pustą wartością, co jest równoznaczne z usunięciem znaków niebędących wyrazami.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Jak zamienić wartości NaN na zera w Pandach
Jak zamienić puste ciągi na NaN w Pandach
Jak zamienić wartości w kolumnie na podstawie warunku w Pandach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *