Hoe de pandas burst()-functie te gebruiken (met voorbeelden)


U kunt de functie pandas burst() gebruiken om elk element van een inlinelijst om te zetten in een DataFrame.

Deze functie gebruikt de volgende basissyntaxis:

 df. explode (' variable_to_explode ')

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: Gebruik de functie explosieve() met Pandas DataFrame

Stel dat we de volgende panda’s DataFrame hebben:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': [['A', 'B', 'C'], ['D', 'E', 'F'], ['G', 'H', 'I']] ,
                   ' position ':['Guard', 'Forward', 'Center'],
                   ' points ': [7, 14, 19]})

#view DataFrame
df

	team position points
0 [A, B, C] Guard 7
1 [D, E, F] Forward 14
2 [G, H, I] Center 19

Houd er rekening mee dat de teamkolom lijsten met teamnamen bevat.

We kunnen de functie explode() gebruiken om elk element van elke lijst op één regel te exploderen:

 #explode team column
df. explode (' team ')

        team position points
0 A Guard 7
0 B Guard 7
0 C Guard 7
1D Forward 14
1 E Forward 14
1 F Forward 14
2G Center 19
2H Center 19
2 I Center 19

Houd er rekening mee dat de teamkolom geen lijsten meer bevat. We hebben elk item in elke lijst op één regel ‚geëxplodeerd‘.

Houd er ook rekening mee dat sommige rijen nu dezelfde indexwaarde hebben.

We kunnen de functie reset_index() gebruiken om de index opnieuw in te stellen bij het barsten van de teamkolom:

 #explode team column and reset index of resulting dataFrame
df. explode (' team '). reset_index (drop= True )

	team position points
0 A Guard 7
1 B Guard 7
2 C Guard 7
3D Forward 14
4 E Forward 14
5 F Forward 14
6G Center 19
7 A.M. Center 19
8 I Center 19

Merk op dat elke rij nu een unieke indexwaarde heeft.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Hoe een stringkolom in Pandas in meerdere kolommen te splitsen
Hoe Panda’s DataFrame in meerdere DataFrames kan worden gesplitst
Hoe Pandas DataFrame te splitsen op kolomwaarde

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert