Panda's: speciale tekens uit een kolom verwijderen


U kunt de volgende basissyntaxis gebruiken om speciale tekens uit een kolom in een Panda DataFrame te verwijderen:

 df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )

In dit specifieke voorbeeld worden alle tekens uit mijn_kolom verwijderd die geen letters of cijfers zijn.

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: verwijder speciale tekens uit de kolom in Panda’s

Stel dat we het volgende panda’s DataFrame hebben dat informatie bevat over verschillende basketbalspelers:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs$ 12
1 Nets 15
2 Kings!! 22
3 Spurs% 29
4 &Heat& 24

Stel dat we alle speciale tekens uit de teamkolomwaarden willen verwijderen.

We kunnen hiervoor de volgende syntaxis gebruiken:

 #remove special characters from team column
df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Spurs 29
4 Heat 24

Houd er rekening mee dat alle speciale tekens zijn verwijderd uit de teamkolomwaarden .

Opmerking : de reguliere expressie \W wordt gebruikt om te zoeken naar alle niet-woordtekens, dat wil zeggen tekens die noch alfabetisch, noch numeriek zijn.

In dit voorbeeld hebben we elk niet-woord-teken vervangen door een lege waarde, wat overeenkomt met het verwijderen van niet-woord-tekens.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Hoe NaN-waarden te vervangen door nullen in Panda’s
Hoe lege strings te vervangen door NaN in Pandas
Hoe waarden in kolommen te vervangen op basis van de voorwaarde in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert