Jak podzielić kolumnę ciągów w pandach na wiele kolumn


Możesz użyć następującej podstawowej składni, aby podzielić kolumnę ciągu w ramce DataFrame pandy na wiele kolumn:

 #split column A into two columns: column A and column B
df[[' A ',' B ']] = df[' A ']. str . split (' , ', 1 , expand= True )

Poniższe przykłady pokazują, jak używać tej składni w praktyce.

Przykład 1: Podziel kolumnę przecinkiem

Poniższy kod pokazuje, jak podzielić kolumnę w ramce DataFrame pandy na podstawie przecinka na dwie oddzielne kolumny:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs, West', 'Spurs, West', 'Nets, East'],
                   ' points ': [112, 104, 127]})

#view DataFrame
df

	team points
0 Mavs, West 112
1 Spurs, West 104
2 Nets, East 127

#split team column into two columns
df[[' team ', ' conference ']] = df[' team ']. str . split (' , ', 1 , expand= True )

#view updated DataFrame
df

	team points conference
0 Mavs 112 West
1 Spurs 104 West
2 Nets 127 East

Pamiętaj, że możesz także zmienić układ kolumn po wykonaniu podziału, jeśli chcesz:

 #reorder columns
df = df[[' team ', ' conference ', ' points ']]

#view DataFrame
df

	team conference points
0 Mavs West 112
1 Spurs West 104
2 Nets East 127

Przykład 2: Podziel kolumnę innymi ogranicznikami

Możemy użyć tej samej składni, aby podzielić kolumnę innymi ogranicznikami.

Na przykład możemy podzielić kolumnę spacją :

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs West', 'Spurs West', 'Nets East'],
                   ' points ': [112, 104, 127]})

#split team column into two columns
df[[' team ', ' conference ']] = df[' team ']. str . split (' ', 1 , expand= True )

#view updated DataFrame
df

	team conference points
0 Mavs West 112
1 Spurs West 104
2 Nets East 127

Możesz także podzielić kolumnę ukośnikiem :

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs/West', 'Spurs/West', 'Nets/East'],
                   ' points ': [112, 104, 127]})

#split team column into two columns
df[[' team ', ' conference ']] = df[' team ']. str . split (' / ', 1 , expand= True )

#view updated DataFrame
df

	team conference points
0 Mavs West 112
1 Spurs West 104
2 Nets East 127

Używając tej składni, możemy podzielić kolumnę dowolnym separatorem.

Dodatkowe zasoby

Jak dodać wiersze do ramki danych Pandas
Jak dodać tablicę Numpy do ramki danych Pandas
Jak policzyć liczbę wierszy w Pandas DataFrame

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *