Pandy: jak usunąć spacje z kolumn


Możesz użyć następujących metod, aby usunąć spacje z kolumn w ramce DataFrame pandy:

Metoda 1: Usuń spacje z kolumny

 df[' my_column '] = df[' my_column ']. str . strip ()

Metoda 2: Usuń spacje ze wszystkich kolumn ciągów

 df = df. apply ( lambda x: x.str.strip () if x.dtype == ' object ' else x )

Poniższe przykłady pokazują, jak w praktyce używać każdej metody z następującą ramką DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Heat', 'Nets', 'Cavs', 'Hawks', 'Jazz'],
                   ' position ': ['Point Guard', 'Small Forward', 'Center',
                                'Power Forward', 'Point Guard', 'Center'],
                   ' points ': [11, 8, 10, 6, 22, 29]})

#view DataFrame
print (df)

     team position points
0 Mavs Point Guard 11
1 Heat Small Forward 8
2 Nets Center 10
3 Cavs Power Forward 6
4 Hawks Point Guard 22
5 Jazz Center 29

Przykład 1: Usuń spacje z kolumny

Poniższy kod pokazuje, jak usunąć spacje z każdego ciągu w kolumnie pozycji :

 #strip whitespace from position column
df[' position '] = df[' position ']. str . strip ()

#view updated DataFrame
print (df)

     team position points
0 Mavs Point Guard 11
1 Heat Small Forward 8
2 Nets Center 10
3 Cavs Power Forward 6
4 Hawks Point Guard 22
5 Jazz Center 29

Należy pamiętać, że z każdego ciągu zawierającego spacje w kolumnie pozycji usunięto wszystkie spacje.

Przykład 2: Usuń spacje ze wszystkich kolumn ciągów

Poniższy kod pokazuje, jak usunąć spacje z każdego ciągu znaków we wszystkich kolumnach ciągów ramki DataFrame:

 #strip whitespace from all string columns
df = df. apply ( lambda x: x.str.strip () if x.dtype == ' object ' else x )

#view updated DataFrame
print (df)

    team position points
0 Mavs Point Guard 11
1 Heat Small Forward 8
2 Nets Center 10
3 Cavs Power Forward 6
4 Hawks Point Guard 22
5 Jazz Center 29

Należy zauważyć, że wszystkie spacje zostały usunięte z kolumn zespołu i pozycji , które są dwiema kolumnami typu string w ramce DataFrame.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:

Pandy: jak wybrać kolumny zawierające określony ciąg
Pandy: Jak filtrować wiersze na podstawie długości łańcucha
Jak utworzyć ramkę danych Pandy z ciągu znaków

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *