O guia definitivo: como ler arquivos excel com pandas
Os arquivos Excel são uma das formas mais comuns de armazenar dados. Felizmente, a função read_excel() do pandas facilita a leitura de arquivos Excel.
Este tutorial explica várias maneiras de ler arquivos Excel em Python usando pandas.
Exemplo 1: Leia um arquivo Excel em um DataFrame do pandas
Suponha que temos o seguinte arquivo Excel:
O código a seguir mostra como usar a função read_excel() para importar este arquivo Excel para um DataFrame do pandas:
import pandas as pd #import Excel file df = pd. read_excel ('data.xlsx') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
Exemplo 2: Leia um arquivo Excel com uma coluna de índice
Às vezes você também pode ter um arquivo Excel onde uma das colunas é uma coluna de índice:
Nesse caso, você pode usar index_col para informar ao pandas qual coluna usar como coluna de índice ao importar:
import pandas as pd #import Excel file, specifying the index column df = pd. read_excel ('data.xlsx', index_col=' index ') #view DataFrame df playerID team points index 1 1 Lakers 26 2 2 Mavs 19 3 3 Bucks 24 4 4 Spurs 22
Exemplo 3: Leia um arquivo Excel usando o nome da planilha
Você também pode ler nomes de planilhas específicas de um arquivo Excel em um DataFrame do pandas. Por exemplo, considere o seguinte arquivo Excel:
Para ler uma planilha específica como um DataFrame do pandas, você pode usar o argumento sheet_name() :
import pandas as pd #import only second sheet df = pd. read_excel ('data.xlsx', sheet_name=' second sheet ') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
Erro comum: instalando o xlrd
Ao tentar usar a função read_excel() , você pode encontrar o seguinte erro:
ImportError: Install xlrd >= 1.0.0 for Excel support
Neste caso, você deve primeiro instalar o xlrd:
pip install xlrd
Uma vez instalado, você pode usar a função read_excel() .
Recursos adicionais
Como ler arquivos CSV com Pandas
Como exportar um DataFrame do Pandas para Excel