Hoe u het pandas dataframe in stukken kunt splitsen


U kunt de volgende basissyntaxis gebruiken om een Panda’s DataFrame in kleinere stukken op te delen:

 #specify number of rows in each chunk
n= 3

#split DataFrame into chunks
list_df = [df[i:i+n] for i in range(0, len (df),n)]

U kunt vervolgens elk segment openen met behulp van de volgende syntaxis:

 #access first chunk
list_df[0]

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: splits het Pandas DataFrame in stukken

Stel dat we het volgende panda’s DataFrame hebben met negen rijen met informatie over verschillende basketbalspelers:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28, 23],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 11],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 10]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12
8 I 23 11 10

We kunnen de volgende syntaxis gebruiken om het DataFrame in stukken te splitsen, waarbij elk stuk uit 3 regels bestaat:

 #specify number of rows in each chunk
n= 3

#split DataFrame into chunks
list_df = [df[i:i+n] for i in range(0, len (df),n)]

We kunnen dan de volgende syntaxis gebruiken om toegang te krijgen tot elk stuk:

 #view first chunk
print (list_df[0])

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10

#view second chunk
print (list_df[1])

  team points assists rebounds
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5

#view third chunk
print (list_df[2])

  team points assists rebounds
6 G 20 9 9
7:28 4 12
8 I 23 11 10

Merk op dat elk deel drie regels bevat, zoals we hebben gespecificeerd.

Merk op dat we in dit voorbeeld een DataFrame met slechts negen rijen als eenvoudig voorbeeld hebben gebruikt.

In de praktijk zul je waarschijnlijk werken met een DataFrame dat honderdduizenden of zelfs miljoenen rijen heeft.

U kunt dezelfde syntaxis gebruiken die in dit voorbeeld wordt gebruikt om uw DataFrame op te splitsen in blokken van specifieke grootte.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Panda’s: een DataFrame splitsen op kolomwaarde
Panda’s: een tekenreekskolom in meerdere kolommen splitsen
Panda’s: hoe u een kolom met lijsten in meerdere kolommen kunt splitsen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert