So teilen sie den pandas dataframe in teile auf


Sie können die folgende grundlegende Syntax verwenden, um einen Pandas-DataFrame in kleinere Teile zu zerlegen:

 #specify number of rows in each chunk
n= 3

#split DataFrame into chunks
list_df = [df[i:i+n] for i in range(0, len (df),n)]

Anschließend können Sie mit der folgenden Syntax auf jeden Block zugreifen:

 #access first chunk
list_df[0]

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Teilen Sie den Pandas DataFrame in Teile

Angenommen, wir haben den folgenden Pandas-DataFrame mit neun Zeilen, die Informationen über verschiedene Basketballspieler enthalten:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28, 23],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 11],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 10]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12
8 I 23 11 10

Wir können die folgende Syntax verwenden, um den DataFrame in Blöcke aufzuteilen, wobei jeder Block drei Zeilen hat:

 #specify number of rows in each chunk
n= 3

#split DataFrame into chunks
list_df = [df[i:i+n] for i in range(0, len (df),n)]

Wir können dann die folgende Syntax verwenden, um auf jedes Stück zuzugreifen:

 #view first chunk
print (list_df[0])

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10

#view second chunk
print (list_df[1])

  team points assists rebounds
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5

#view third chunk
print (list_df[2])

  team points assists rebounds
6 G 20 9 9
7:28 4 12
8 I 23 11 10

Beachten Sie, dass jeder Block, wie von uns angegeben, drei Zeilen enthält.

Beachten Sie, dass wir in diesem Beispiel als einfaches Beispiel einen DataFrame mit nur neun Zeilen verwendet haben.

In der Praxis werden Sie wahrscheinlich mit einem DataFrame arbeiten, der Hunderttausende oder sogar Millionen Zeilen enthält.

Sie können dieselbe Syntax wie in diesem Beispiel verwenden, um Ihren DataFrame in Blöcke bestimmter Größen aufzuteilen.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:

Pandas: So teilen Sie einen DataFrame nach Spaltenwert auf
Pandas: So teilen Sie eine Zeichenfolgenspalte in mehrere Spalten auf
Pandas: So teilen Sie eine Listenspalte in mehrere Spalten auf

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert