Panda: come rimuovere caratteri specifici dalle stringhe


È possibile utilizzare i seguenti metodi per rimuovere caratteri specifici dalle stringhe in una colonna in un DataFrame panda:

Metodo 1: rimuovere caratteri specifici dalle stringhe

 df[' my_column '] = df[' my_column ']. str . replace (' this_string ', '')

Metodo 2: rimuovi tutte le lettere dalle stringhe

 df[' my_column '] = df[' my_column ']. str . replace (' \D ', '', regex= True )

Metodo 3: rimuovi tutti i numeri dalle stringhe

 df[' my_column '] = df[' my_column ']. str . replace (' \d+ ', '', regex= True )

I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con i seguenti DataFrame panda:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs2', 'Nets44', 'Kings33', 'Cavs90', 'Heat576'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs2 12
1 Nets44 15
2 Kings33 22
3 Cavs90 29
4 Heat576 24

Esempio 1: rimuovere caratteri specifici dalle stringhe

Possiamo usare la seguente sintassi per rimuovere “avs” da ogni stringa nella colonna della squadra :

 #remove 'avs' from strings in team column
df[' team '] = df[' team ']. str . replace (' avs ', '')

#view updated DataFrame
print (df)

      team points
0 M2 12
1 Nets44 15
2 Kings33 22
3 C90 29
4 Heat576 24

Tieni presente che “avs” è stato rimosso dalle righe contenenti “Mavs” e “Cavs” nella colonna della squadra .

Esempio 2: rimuovi tutte le lettere dalle stringhe

Possiamo utilizzare la seguente sintassi per rimuovere tutte le lettere da ciascuna stringa nella colonna della squadra :

 #remove letters from strings in team column
df[' team '] = df[' team ']. str . replace (' \D ', '', regex= True )

#view updated DataFrame
print (df)

  team points
0 2 12
1 44 15
2 33 22
3 90 29
4,576 24

Tieni presente che tutte le lettere sono state rimosse da ciascuna stringa nella colonna della squadra .

Rimangono solo i valori numerici.

Esempio 3: rimuovi tutti i numeri dalle stringhe

Possiamo utilizzare la seguente sintassi per rimuovere tutti i numeri da ciascuna stringa nella colonna della squadra :

 #remove numbers from strings in team column
df[' team '] = df[' team ']. str . replace (' \d+ ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Cavs 29
4 Heat 24

Tieni presente che tutti i numeri sono stati rimossi da ciascuna stringa nella colonna della squadra .

Rimangono solo le lettere.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:

Come sostituire i valori NaN con zeri in Panda
Come sostituire le stringhe vuote con NaN in Pandas
Come sostituire i valori nella colonna in base alle condizioni in Panda

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *