Pandas: so entfernen sie leerzeichen aus spalten


Sie können die folgenden Methoden verwenden, um Leerzeichen aus Spalten in einem Pandas-DataFrame zu entfernen:

Methode 1: Leerzeichen aus einer Spalte entfernen

 df[' my_column '] = df[' my_column ']. str . strip ()

Methode 2: Entfernen Sie Leerzeichen aus allen Zeichenfolgenspalten

 df = df. apply ( lambda x: x.str.strip () if x.dtype == ' object ' else x )

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Heat', 'Nets', 'Cavs', 'Hawks', 'Jazz'],
                   ' position ': ['Point Guard', 'Small Forward', 'Center',
                                'Power Forward', 'Point Guard', 'Center'],
                   ' points ': [11, 8, 10, 6, 22, 29]})

#view DataFrame
print (df)

     team position points
0 Mavs Point Guard 11
1 Heat Small Forward 8
2 Nets Center 10
3 Cavs Power Forward 6
4 Hawks Point Guard 22
5 Jazz Center 29

Beispiel 1: Leerzeichen aus einer Spalte entfernen

Der folgende Code zeigt, wie Leerzeichen aus jeder Zeichenfolge in der Positionsspalte entfernt werden:

 #strip whitespace from position column
df[' position '] = df[' position ']. str . strip ()

#view updated DataFrame
print (df)

     team position points
0 Mavs Point Guard 11
1 Heat Small Forward 8
2 Nets Center 10
3 Cavs Power Forward 6
4 Hawks Point Guard 22
5 Jazz Center 29

Beachten Sie, dass alle Leerzeichen aus jeder Zeichenfolge mit Leerzeichen in der Positionsspalte entfernt wurden.

Beispiel 2: Leerzeichen aus allen Zeichenfolgenspalten entfernen

Der folgende Code zeigt, wie Leerzeichen aus jeder Zeichenfolge in allen Zeichenfolgenspalten des DataFrame entfernt werden:

 #strip whitespace from all string columns
df = df. apply ( lambda x: x.str.strip () if x.dtype == ' object ' else x )

#view updated DataFrame
print (df)

    team position points
0 Mavs Point Guard 11
1 Heat Small Forward 8
2 Nets Center 10
3 Cavs Power Forward 6
4 Hawks Point Guard 22
5 Jazz Center 29

Beachten Sie, dass alle Leerzeichen aus den Team- und Positionsspalten entfernt wurden, bei denen es sich um die beiden Zeichenfolgenspalten im DataFrame handelt.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in Pandas ausgeführt werden:

Pandas: So wählen Sie Spalten aus, die eine bestimmte Zeichenfolge enthalten
Pandas: So filtern Sie Zeilen basierend auf der Zeichenfolgenlänge
So erstellen Sie einen Pandas DataFrame aus einer Zeichenfolge

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert