Panda: come rimuovere caratteri speciali dalla colonna


È possibile utilizzare la seguente sintassi di base per rimuovere caratteri speciali da una colonna in un DataFrame panda:

 df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )

Questo particolare esempio rimuoverà tutti i caratteri da my_column che non sono né lettere né numeri.

L’esempio seguente mostra come utilizzare questa sintassi nella pratica.

Esempio: rimuovi i caratteri speciali dalla colonna in Pandas

Supponiamo di avere il seguente DataFrame panda che contiene informazioni su vari giocatori di basket:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs$ 12
1 Nets 15
2 Kings!! 22
3 Spurs% 29
4 &Heat& 24

Diciamo che vogliamo rimuovere tutti i caratteri speciali dai valori della colonna della squadra .

Possiamo usare la seguente sintassi per fare questo:

 #remove special characters from team column
df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Spurs 29
4 Heat 24

Tieni presente che tutti i caratteri speciali sono stati rimossi dai valori della colonna della squadra .

Nota : l’espressione regolare \W viene utilizzata per cercare tutti i caratteri non verbali, ovvero i caratteri che non sono né alfabetici né numerici.

In questo esempio, abbiamo sostituito ogni carattere non verbale con un valore vuoto, il che equivale a rimuovere caratteri non verbali.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:

Come sostituire i valori NaN con zeri in Panda
Come sostituire le stringhe vuote con NaN in Pandas
Come sostituire i valori nella colonna in base alle condizioni in Panda

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *