Panda: come rimuovere caratteri specifici dalle stringhe
È possibile utilizzare i seguenti metodi per rimuovere caratteri specifici dalle stringhe in una colonna in un DataFrame panda:
Metodo 1: rimuovere caratteri specifici dalle stringhe
df[' my_column '] = df[' my_column ']. str . replace (' this_string ', '')
Metodo 2: rimuovi tutte le lettere dalle stringhe
df[' my_column '] = df[' my_column ']. str . replace (' \D ', '', regex= True )
Metodo 3: rimuovi tutti i numeri dalle stringhe
df[' my_column '] = df[' my_column ']. str . replace (' \d+ ', '', regex= True )
I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con i seguenti DataFrame panda:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs2', 'Nets44', 'Kings33', 'Cavs90', 'Heat576'], ' points ': [12, 15, 22, 29, 24]}) #view DataFrame print (df) team points 0 Mavs2 12 1 Nets44 15 2 Kings33 22 3 Cavs90 29 4 Heat576 24
Esempio 1: rimuovere caratteri specifici dalle stringhe
Possiamo usare la seguente sintassi per rimuovere “avs” da ogni stringa nella colonna della squadra :
#remove 'avs' from strings in team column df[' team '] = df[' team ']. str . replace (' avs ', '') #view updated DataFrame print (df) team points 0 M2 12 1 Nets44 15 2 Kings33 22 3 C90 29 4 Heat576 24
Tieni presente che “avs” è stato rimosso dalle righe contenenti “Mavs” e “Cavs” nella colonna della squadra .
Esempio 2: rimuovi tutte le lettere dalle stringhe
Possiamo utilizzare la seguente sintassi per rimuovere tutte le lettere da ciascuna stringa nella colonna della squadra :
#remove letters from strings in team column df[' team '] = df[' team ']. str . replace (' \D ', '', regex= True ) #view updated DataFrame print (df) team points 0 2 12 1 44 15 2 33 22 3 90 29 4,576 24
Tieni presente che tutte le lettere sono state rimosse da ciascuna stringa nella colonna della squadra .
Rimangono solo i valori numerici.
Esempio 3: rimuovi tutti i numeri dalle stringhe
Possiamo utilizzare la seguente sintassi per rimuovere tutti i numeri da ciascuna stringa nella colonna della squadra :
#remove numbers from strings in team column df[' team '] = df[' team ']. str . replace (' \d+ ', '', regex= True ) #view updated DataFrame print (df) team points 0 Mavs 12 1 Nets 15 2 Kings 22 3 Cavs 29 4 Heat 24
Tieni presente che tutti i numeri sono stati rimossi da ciascuna stringa nella colonna della squadra .
Rimangono solo le lettere.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:
Come sostituire i valori NaN con zeri in Panda
Come sostituire le stringhe vuote con NaN in Pandas
Come sostituire i valori nella colonna in base alle condizioni in Panda