Como combinar várias planilhas do excel no pandas
Freqüentemente, você pode querer importar e combinar várias planilhas do Excel em um único DataFrame do pandas.
Por exemplo, suponha que você tenha a seguinte pasta de trabalho do Excel chamada data.xlsx com três planilhas diferentes, todas contendo duas colunas de dados de jogadores de basquete:
Podemos facilmente importar e combinar cada planilha em um único DataFrame do pandas usando as funções concat() e read_excel() do pandas, mas primeiro precisamos ter certeza de que o xlrd está instalado:
pip install xlrd
Uma vez instalado, podemos usar o seguinte código para importar e combinar essas três planilhas em um único Pandas DataFrame:
#load pandas library import pandas as pd #import and combine the three sheets into one pandas DataFrame df = pd. concat (pd. read_excel ('data.xlsx', sheet_name= None ), ignore_index= True ) #view DataFrame df player points 0 to 12 1 B 5 2 C 13 3 D 17 4 E 27 5 F 24 6 G 26 7:27 a.m. 8 I 27 9 D 12 10K 9 11 L 5 12 M 5 13 N 13 14 O 17
Como funciona esse código
Existem apenas duas partes para entender como esta única linha de código é capaz de importar e combinar várias planilhas do Excel:
1. Leia todas as fichas.
p.d. read_excel ('data.xlsx', sheet_name= None )
Este trecho de código é lido em todas as planilhas de uma pasta de trabalho do Excel. Por padrão, a função read_excel() lê apenas a primeira planilha, mas especificando sheet_name=None podemos ler cada planilha na pasta de trabalho do Excel.
2. Concatene todas as planilhas.
p.d. concat ( DataFrames to concatenate , ignore_index= True )
Este trecho de código simplesmente concatena todos os DataFrames de cada planilha do Excel em um único DataFrame do pandas. Ao especificar ignore_index=True , dizemos aos pandas que os nomes das folhas individuais não são importantes.
Observe que este código só funciona se cada uma das planilhas do Excel tiver o mesmo formato. Neste exemplo, cada planilha tinha duas colunas de dados e cada coluna tinha o mesmo nome, e é por isso que essa única linha de código funcionou tão facilmente para combinar cada uma das planilhas do Excel em um único DataFrame do pandas.
Recursos adicionais
O guia definitivo: como ler arquivos Excel com Pandas
Como escrever Pandas DataFrames em várias planilhas do Excel