Pandas: so entfernen sie bestimmte zeichen aus zeichenfolgen
Sie können die folgenden Methoden verwenden, um bestimmte Zeichen aus Zeichenfolgen in einer Spalte in einem Pandas-DataFrame zu entfernen:
Methode 1: Bestimmte Zeichen aus Zeichenfolgen entfernen
df[' my_column '] = df[' my_column ']. str . replace (' this_string ', '')
Methode 2: Entfernen Sie alle Buchstaben aus Zeichenfolgen
df[' my_column '] = df[' my_column ']. str . replace (' \D ', '', regex= True )
Methode 3: Entfernen Sie alle Zahlen aus Zeichenfolgen
df[' my_column '] = df[' my_column ']. str . replace (' \d+ ', '', regex= True )
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs2', 'Nets44', 'Kings33', 'Cavs90', 'Heat576'], ' points ': [12, 15, 22, 29, 24]}) #view DataFrame print (df) team points 0 Mavs2 12 1 Nets44 15 2 Kings33 22 3 Cavs90 29 4 Heat576 24
Beispiel 1: Bestimmte Zeichen aus Zeichenfolgen entfernen
Wir können die folgende Syntax verwenden, um „avs“ aus jeder Zeichenfolge in der Teamspalte zu entfernen:
#remove 'avs' from strings in team column df[' team '] = df[' team ']. str . replace (' avs ', '') #view updated DataFrame print (df) team points 0 M2 12 1 Nets44 15 2 Kings33 22 3 C90 29 4 Heat576 24
Beachten Sie, dass „avs“ aus den Zeilen mit „Mavs“ und „Cavs“ in der Teamspalte entfernt wurde.
Beispiel 2: Entfernen Sie alle Buchstaben aus Zeichenfolgen
Wir können die folgende Syntax verwenden, um alle Buchstaben aus jeder Zeichenfolge in der Teamspalte zu entfernen:
#remove letters from strings in team column df[' team '] = df[' team ']. str . replace (' \D ', '', regex= True ) #view updated DataFrame print (df) team points 0 2 12 1 44 15 2 33 22 3 90 29 4,576 24
Beachten Sie, dass alle Buchstaben aus jeder Zeichenfolge in der Teamspalte entfernt wurden.
Es bleiben nur Zahlenwerte übrig.
Beispiel 3: Entfernen Sie alle Zahlen aus Zeichenfolgen
Wir können die folgende Syntax verwenden, um alle Zahlen aus jeder Zeichenfolge in der Teamspalte zu entfernen:
#remove numbers from strings in team column df[' team '] = df[' team ']. str . replace (' \d+ ', '', regex= True ) #view updated DataFrame print (df) team points 0 Mavs 12 1 Nets 15 2 Kings 22 3 Cavs 29 4 Heat 24
Beachten Sie, dass alle Zahlen aus jeder Zeichenfolge in der Teamspalte entfernt wurden.
Nur die Buchstaben bleiben übrig.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:
So ersetzen Sie NaN-Werte in Pandas durch Nullen
So ersetzen Sie leere Zeichenfolgen in Pandas durch NaN
So ersetzen Sie Werte in einer Spalte basierend auf der Bedingung in Pandas