Hoe een stringkolom in pandas in meerdere kolommen te splitsen


U kunt de volgende basissyntaxis gebruiken om een tekenreekskolom in een Pandas DataFrame in meerdere kolommen te splitsen:

 #split column A into two columns: column A and column B
df[[' A ',' B ']] = df[' A ']. str . split (' , ', 1 , expand= True )

De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld 1: Kolom delen door komma

De volgende code laat zien hoe u een kolom in een Panda DataFrame, op basis van een komma, in twee afzonderlijke kolommen splitst:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs, West', 'Spurs, West', 'Nets, East'],
                   ' points ': [112, 104, 127]})

#view DataFrame
df

	team points
0 Mavs, West 112
1 Spurs, West 104
2 Nets, East 127

#split team column into two columns
df[[' team ', ' conference ']] = df[' team ']. str . split (' , ', 1 , expand= True )

#view updated DataFrame
df

	team points conference
0 Mavs 112 West
1 Spurs 104 West
2 Nets 127 East

Houd er rekening mee dat u de kolommen ook opnieuw kunt rangschikken nadat u de splitsing hebt uitgevoerd als u dat wilt:

 #reorder columns
df = df[[' team ', ' conference ', ' points ']]

#view DataFrame
df

	team conference points
0 Mavs West 112
1 Spurs West 104
2 Nets East 127

Voorbeeld 2: Kolom splitsen door andere scheidingstekens

We kunnen dezelfde syntaxis gebruiken om een kolom te verdelen door andere scheidingstekens.

We kunnen een kolom bijvoorbeeld delen door een spatie :

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs West', 'Spurs West', 'Nets East'],
                   ' points ': [112, 104, 127]})

#split team column into two columns
df[[' team ', ' conference ']] = df[' team ']. str . split (' ', 1 , expand= True )

#view updated DataFrame
df

	team conference points
0 Mavs West 112
1 Spurs West 104
2 Nets East 127

Je kunt een kolom ook verdelen met een schuine streep :

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs/West', 'Spurs/West', 'Nets/East'],
                   ' points ': [112, 104, 127]})

#split team column into two columns
df[[' team ', ' conference ']] = df[' team ']. str . split (' / ', 1 , expand= True )

#view updated DataFrame
df

	team conference points
0 Mavs West 112
1 Spurs West 104
2 Nets East 127

Met behulp van deze syntaxis kunnen we een kolom splitsen met elk gewenst scheidingsteken.

Aanvullende bronnen

Rijen toevoegen aan een Pandas DataFrame
Hoe u een Numpy-array aan een Pandas DataFrame toevoegt
Hoe het aantal rijen in Pandas DataFrame te tellen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert