Pandas: so entfernen sie bestimmte zeichen aus zeichenfolgen


Sie können die folgenden Methoden verwenden, um bestimmte Zeichen aus Zeichenfolgen in einer Spalte in einem Pandas-DataFrame zu entfernen:

Methode 1: Bestimmte Zeichen aus Zeichenfolgen entfernen

 df[' my_column '] = df[' my_column ']. str . replace (' this_string ', '')

Methode 2: Entfernen Sie alle Buchstaben aus Zeichenfolgen

 df[' my_column '] = df[' my_column ']. str . replace (' \D ', '', regex= True )

Methode 3: Entfernen Sie alle Zahlen aus Zeichenfolgen

 df[' my_column '] = df[' my_column ']. str . replace (' \d+ ', '', regex= True )

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs2', 'Nets44', 'Kings33', 'Cavs90', 'Heat576'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs2 12
1 Nets44 15
2 Kings33 22
3 Cavs90 29
4 Heat576 24

Beispiel 1: Bestimmte Zeichen aus Zeichenfolgen entfernen

Wir können die folgende Syntax verwenden, um „avs“ aus jeder Zeichenfolge in der Teamspalte zu entfernen:

 #remove 'avs' from strings in team column
df[' team '] = df[' team ']. str . replace (' avs ', '')

#view updated DataFrame
print (df)

      team points
0 M2 12
1 Nets44 15
2 Kings33 22
3 C90 29
4 Heat576 24

Beachten Sie, dass „avs“ aus den Zeilen mit „Mavs“ und „Cavs“ in der Teamspalte entfernt wurde.

Beispiel 2: Entfernen Sie alle Buchstaben aus Zeichenfolgen

Wir können die folgende Syntax verwenden, um alle Buchstaben aus jeder Zeichenfolge in der Teamspalte zu entfernen:

 #remove letters from strings in team column
df[' team '] = df[' team ']. str . replace (' \D ', '', regex= True )

#view updated DataFrame
print (df)

  team points
0 2 12
1 44 15
2 33 22
3 90 29
4,576 24

Beachten Sie, dass alle Buchstaben aus jeder Zeichenfolge in der Teamspalte entfernt wurden.

Es bleiben nur Zahlenwerte übrig.

Beispiel 3: Entfernen Sie alle Zahlen aus Zeichenfolgen

Wir können die folgende Syntax verwenden, um alle Zahlen aus jeder Zeichenfolge in der Teamspalte zu entfernen:

 #remove numbers from strings in team column
df[' team '] = df[' team ']. str . replace (' \d+ ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Cavs 29
4 Heat 24

Beachten Sie, dass alle Zahlen aus jeder Zeichenfolge in der Teamspalte entfernt wurden.

Nur die Buchstaben bleiben übrig.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:

So ersetzen Sie NaN-Werte in Pandas durch Nullen
So ersetzen Sie leere Zeichenfolgen in Pandas durch NaN
So ersetzen Sie Werte in einer Spalte basierend auf der Bedingung in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert