Panda's: spaties uit kolommen verwijderen


U kunt de volgende methoden gebruiken om spaties uit kolommen in een pandas DataFrame te verwijderen:

Methode 1: Spaties uit een kolom verwijderen

 df[' my_column '] = df[' my_column ']. str . strip ()

Methode 2: Verwijder spaties uit alle tekenreekskolommen

 df = df. apply ( lambda x: x.str.strip () if x.dtype == ' object ' else x )

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met de volgende panda’s DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Heat', 'Nets', 'Cavs', 'Hawks', 'Jazz'],
                   ' position ': ['Point Guard', 'Small Forward', 'Center',
                                'Power Forward', 'Point Guard', 'Center'],
                   ' points ': [11, 8, 10, 6, 22, 29]})

#view DataFrame
print (df)

     team position points
0 Mavs Point Guard 11
1 Heat Small Forward 8
2 Nets Center 10
3 Cavs Power Forward 6
4 Hawks Point Guard 22
5 Jazz Center 29

Voorbeeld 1: Spaties uit een kolom verwijderen

De volgende code laat zien hoe u spaties verwijdert uit elke tekenreeks in de positiekolom :

 #strip whitespace from position column
df[' position '] = df[' position ']. str . strip ()

#view updated DataFrame
print (df)

     team position points
0 Mavs Point Guard 11
1 Heat Small Forward 8
2 Nets Center 10
3 Cavs Power Forward 6
4 Hawks Point Guard 22
5 Jazz Center 29

Merk op dat alle spaties uit elke string zijn verwijderd met spaties in de positiekolom .

Voorbeeld 2: Verwijder spaties uit alle tekenreekskolommen

De volgende code laat zien hoe u spaties verwijdert uit elke tekenreeks in alle tekenreekskolommen van het DataFrame:

 #strip whitespace from all string columns
df = df. apply ( lambda x: x.str.strip () if x.dtype == ' object ' else x )

#view updated DataFrame
print (df)

    team position points
0 Mavs Point Guard 11
1 Heat Small Forward 8
2 Nets Center 10
3 Cavs Power Forward 6
4 Hawks Point Guard 22
5 Jazz Center 29

Houd er rekening mee dat alle spaties zijn verwijderd uit de team- en positiekolommen , dit zijn de twee tekenreekskolommen in het DataFrame.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Panda’s: kolommen selecteren die een specifieke string bevatten
Panda’s: rijen filteren op basis van tekenreekslengte
Hoe u een Pandas DataFrame kunt maken op basis van een string

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert