Como adicionar vários dataframes pandas (com exemplo)


Você pode usar a seguinte sintaxe básica para adicionar vários DataFrames do pandas de uma só vez:

 import pandas as pd

#append multiple DataFrames
df_big = pd. concat ([df1,df2, df3], ignore_index= True ) 

Esta sintaxe específica adicionará df1 , df2 e df3 em um único DataFrame do pandas chamado df_big .

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo 1: Adicionar vários DataFrames Pandas de uma vez

O código a seguir mostra como adicionar vários DataFrames pandas de uma só vez:

 import pandas as pd

#create three DataFrames
df1 = pd. DataFrame ({'player': ['A', 'B', 'C', 'D', 'E'],
                    'points':[12, 5, 13, 17, 27]})

df2 = pd. DataFrame ({'player': ['F', 'G', 'H', 'I', 'J'],
                    'points':[24, 26, 27, 27, 12]})

df3 = pd. DataFrame ({'player': ['K', 'L', 'M', 'N', 'O'],
                    'points':[9, 5, 5, 13, 17]})

#append all DataFrames into one DataFrame
df_big = pd. concat ([df1,df2, df3], ignore_index= True )

#view resulting DataFrame
print (df_big)

        player points
0 to 12
1 B 5
2 C 13
3 D 17
4 E 27
5 F 24
6 G 26
7:27 a.m.
8 I 27
9 D 12
10K 9
11 L 5
12 M 5
13 N 13
14 O 17

O resultado é um DataFrame grande que contém todas as linhas de cada um dos três DataFrames individuais.

O argumento ignore_index=True diz ao pandas para ignorar os números de índice originais em cada DataFrame e criar um novo índice que comece em 0 para o novo DataFrame.

Por exemplo, considere o que acontece quando não usamos ignore_index=True ao empilhar os dois DataFrames a seguir:

 import pandas as pd

#create two DataFrames with indices
df1 = pd. DataFrame ({'player': ['A', 'B', 'C', 'D', 'E'],
                    'points':[12, 5, 13, 17, 27]},
                    index=[0, 1, 2, 3, 4])

df2 = pd. DataFrame ({'player': ['F', 'G', 'H', 'I', 'J'],
                    'points':[24, 26, 27, 27, 12]},
                    index=[2, 4, 5, 6, 9])

#stack the two DataFrames together
df_big = pd. concat ([df1,df2])

#view resulting DataFrame
print (df_big)

        player points
0 to 12
1 B 5
2 C 13
3 D 17
4 E 27
2 F 24
4G 26
5:27 a.m.
6 I 27
9 D 12

O DataFrame resultante manteve seus valores de índice originais de ambos os DataFrames.

Em geral, você deve usar ignore_index=True ao adicionar vários DataFrames, a menos que tenha um motivo específico para manter os valores de índice originais.

Recursos adicionais

Como adicionar uma coluna vazia a um DataFrame do Pandas
Como inserir uma coluna em um DataFrame do Pandas
Como exportar um DataFrame do Pandas para Excel

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *