Panda's: speciale tekens uit een kolom verwijderen
U kunt de volgende basissyntaxis gebruiken om speciale tekens uit een kolom in een Panda DataFrame te verwijderen:
df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )
In dit specifieke voorbeeld worden alle tekens uit mijn_kolom verwijderd die geen letters of cijfers zijn.
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: verwijder speciale tekens uit de kolom in Panda’s
Stel dat we het volgende panda’s DataFrame hebben dat informatie bevat over verschillende basketbalspelers:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'], ' points ': [12, 15, 22, 29, 24]}) #view DataFrame print (df) team points 0 Mavs$ 12 1 Nets 15 2 Kings!! 22 3 Spurs% 29 4 &Heat& 24
Stel dat we alle speciale tekens uit de teamkolomwaarden willen verwijderen.
We kunnen hiervoor de volgende syntaxis gebruiken:
#remove special characters from team column df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True ) #view updated DataFrame print (df) team points 0 Mavs 12 1 Nets 15 2 Kings 22 3 Spurs 29 4 Heat 24
Houd er rekening mee dat alle speciale tekens zijn verwijderd uit de teamkolomwaarden .
Opmerking : de reguliere expressie \W wordt gebruikt om te zoeken naar alle niet-woordtekens, dat wil zeggen tekens die noch alfabetisch, noch numeriek zijn.
In dit voorbeeld hebben we elk niet-woord-teken vervangen door een lege waarde, wat overeenkomt met het verwijderen van niet-woord-tekens.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:
Hoe NaN-waarden te vervangen door nullen in Panda’s
Hoe lege strings te vervangen door NaN in Pandas
Hoe waarden in kolommen te vervangen op basis van de voorwaarde in Pandas