Como dividir o dataframe do pandas em pedaços
Você pode usar a seguinte sintaxe básica para quebrar um DataFrame do pandas em pedaços menores:
#specify number of rows in each chunk n= 3 #split DataFrame into chunks list_df = [df[i:i+n] for i in range(0, len (df),n)]
Você pode então acessar cada pedaço usando a seguinte sintaxe:
#access first chunk
list_df[0]
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: divida o DataFrame do Pandas em pedaços
Suponha que temos o seguinte DataFrame do pandas com nove linhas contendo informações sobre vários jogadores de basquete:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28, 23], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 11], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 10]}) #view DataFrame print (df) team points assists rebounds 0 A 18 5 11 1 B 22 7 8 2 C 19 7 10 3 D 14 9 6 4 E 14 12 6 5 F 11 9 5 6 G 20 9 9 7:28 4 12 8 I 23 11 10
Podemos usar a seguinte sintaxe para dividir o DataFrame em pedaços onde cada pedaço possui 3 linhas:
#specify number of rows in each chunk n= 3 #split DataFrame into chunks list_df = [df[i:i+n] for i in range(0, len (df),n)]
Podemos então usar a seguinte sintaxe para acessar cada parte:
#view first chunk
print (list_df[0])
team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
#view second chunk
print (list_df[1])
team points assists rebounds
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
#view third chunk
print (list_df[2])
team points assists rebounds
6 G 20 9 9
7:28 4 12
8 I 23 11 10
Observe que cada pedaço contém três linhas, conforme especificamos.
Observe que neste exemplo usamos um DataFrame com apenas nove linhas como exemplo simples.
Na prática, você provavelmente trabalhará com um DataFrame que possui centenas de milhares ou até milhões de linhas.
Você pode usar a mesma sintaxe usada neste exemplo para dividir seu DataFrame em pedaços de tamanhos específicos.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:
Pandas: Como dividir um DataFrame por valor de coluna
Pandas: Como dividir uma coluna de string em múltiplas colunas
Pandas: Como dividir uma coluna de listas em múltiplas colunas