Jak podzielić kolumnę ciągów w pandach na wiele kolumn
Możesz użyć następującej podstawowej składni, aby podzielić kolumnę ciągu w ramce DataFrame pandy na wiele kolumn:
#split column A into two columns: column A and column B df[[' A ',' B ']] = df[' A ']. str . split (' , ', 1 , expand= True )
Poniższe przykłady pokazują, jak używać tej składni w praktyce.
Przykład 1: Podziel kolumnę przecinkiem
Poniższy kod pokazuje, jak podzielić kolumnę w ramce DataFrame pandy na podstawie przecinka na dwie oddzielne kolumny:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs, West', 'Spurs, West', 'Nets, East'], ' points ': [112, 104, 127]}) #view DataFrame df team points 0 Mavs, West 112 1 Spurs, West 104 2 Nets, East 127 #split team column into two columns df[[' team ', ' conference ']] = df[' team ']. str . split (' , ', 1 , expand= True ) #view updated DataFrame df team points conference 0 Mavs 112 West 1 Spurs 104 West 2 Nets 127 East
Pamiętaj, że możesz także zmienić układ kolumn po wykonaniu podziału, jeśli chcesz:
#reorder columns
df = df[[' team ', ' conference ', ' points ']]
#view DataFrame
df
team conference points
0 Mavs West 112
1 Spurs West 104
2 Nets East 127
Przykład 2: Podziel kolumnę innymi ogranicznikami
Możemy użyć tej samej składni, aby podzielić kolumnę innymi ogranicznikami.
Na przykład możemy podzielić kolumnę spacją :
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs West', 'Spurs West', 'Nets East'], ' points ': [112, 104, 127]}) #split team column into two columns df[[' team ', ' conference ']] = df[' team ']. str . split (' ', 1 , expand= True ) #view updated DataFrame df team conference points 0 Mavs West 112 1 Spurs West 104 2 Nets East 127
Możesz także podzielić kolumnę ukośnikiem :
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs/West', 'Spurs/West', 'Nets/East'], ' points ': [112, 104, 127]}) #split team column into two columns df[[' team ', ' conference ']] = df[' team ']. str . split (' / ', 1 , expand= True ) #view updated DataFrame df team conference points 0 Mavs West 112 1 Spurs West 104 2 Nets East 127
Używając tej składni, możemy podzielić kolumnę dowolnym separatorem.
Dodatkowe zasoby
Jak dodać wiersze do ramki danych Pandas
Jak dodać tablicę Numpy do ramki danych Pandas
Jak policzyć liczbę wierszy w Pandas DataFrame