Como combinar várias planilhas do excel no pandas


Freqüentemente, você pode querer importar e combinar várias planilhas do Excel em um único DataFrame do pandas.

Por exemplo, suponha que você tenha a seguinte pasta de trabalho do Excel chamada data.xlsx com três planilhas diferentes, todas contendo duas colunas de dados de jogadores de basquete:

Podemos facilmente importar e combinar cada planilha em um único DataFrame do pandas usando as funções concat() e read_excel() do pandas, mas primeiro precisamos ter certeza de que o xlrd está instalado:

 pip install xlrd

Uma vez instalado, podemos usar o seguinte código para importar e combinar essas três planilhas em um único Pandas DataFrame:

 #load pandas library
import pandas as pd

#import and combine the three sheets into one pandas DataFrame
df = pd. concat (pd. read_excel ('data.xlsx', sheet_name= None ), ignore_index= True )

#view DataFrame
df

        player points
0 to 12
1 B 5
2 C 13
3 D 17
4 E 27
5 F 24
6 G 26
7:27 a.m.
8 I 27
9 D 12
10K 9
11 L 5
12 M 5
13 N 13
14 O 17

Como funciona esse código

Existem apenas duas partes para entender como esta única linha de código é capaz de importar e combinar várias planilhas do Excel:

1. Leia todas as fichas.

 p.d. read_excel ('data.xlsx', sheet_name= None )

Este trecho de código é lido em todas as planilhas de uma pasta de trabalho do Excel. Por padrão, a função read_excel() lê apenas a primeira planilha, mas especificando sheet_name=None podemos ler cada planilha na pasta de trabalho do Excel.

2. Concatene todas as planilhas.

 p.d. concat ( DataFrames to concatenate , ignore_index= True )

Este trecho de código simplesmente concatena todos os DataFrames de cada planilha do Excel em um único DataFrame do pandas. Ao especificar ignore_index=True , dizemos aos pandas que os nomes das folhas individuais não são importantes.

Observe que este código só funciona se cada uma das planilhas do Excel tiver o mesmo formato. Neste exemplo, cada planilha tinha duas colunas de dados e cada coluna tinha o mesmo nome, e é por isso que essa única linha de código funcionou tão facilmente para combinar cada uma das planilhas do Excel em um único DataFrame do pandas.

Recursos adicionais

O guia definitivo: como ler arquivos Excel com Pandas
Como escrever Pandas DataFrames em várias planilhas do Excel

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *