Como dividir o dataframe do pandas em pedaços


Você pode usar a seguinte sintaxe básica para quebrar um DataFrame do pandas em pedaços menores:

 #specify number of rows in each chunk
n= 3

#split DataFrame into chunks
list_df = [df[i:i+n] for i in range(0, len (df),n)]

Você pode então acessar cada pedaço usando a seguinte sintaxe:

 #access first chunk
list_df[0]

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: divida o DataFrame do Pandas em pedaços

Suponha que temos o seguinte DataFrame do pandas com nove linhas contendo informações sobre vários jogadores de basquete:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28, 23],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 11],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 10]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12
8 I 23 11 10

Podemos usar a seguinte sintaxe para dividir o DataFrame em pedaços onde cada pedaço possui 3 linhas:

 #specify number of rows in each chunk
n= 3

#split DataFrame into chunks
list_df = [df[i:i+n] for i in range(0, len (df),n)]

Podemos então usar a seguinte sintaxe para acessar cada parte:

 #view first chunk
print (list_df[0])

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10

#view second chunk
print (list_df[1])

  team points assists rebounds
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5

#view third chunk
print (list_df[2])

  team points assists rebounds
6 G 20 9 9
7:28 4 12
8 I 23 11 10

Observe que cada pedaço contém três linhas, conforme especificamos.

Observe que neste exemplo usamos um DataFrame com apenas nove linhas como exemplo simples.

Na prática, você provavelmente trabalhará com um DataFrame que possui centenas de milhares ou até milhões de linhas.

Você pode usar a mesma sintaxe usada neste exemplo para dividir seu DataFrame em pedaços de tamanhos específicos.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:

Pandas: Como dividir um DataFrame por valor de coluna
Pandas: Como dividir uma coluna de string em múltiplas colunas
Pandas: Como dividir uma coluna de listas em múltiplas colunas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *