Pandas: ignore colunas específicas ao importar um arquivo excel
Você pode usar a seguinte sintaxe básica para ignorar colunas específicas ao importar um arquivo Excel para um DataFrame do pandas:
#define columns to skip skip_cols = [1, 2] #define columns to keep keep_cols = [i for i in range (4) if i not in skip_cols] #import Excel file and skip specific columns df = pd. read_excel (' my_data.xlsx ', usecols=keep_cols)
Este exemplo específico irá ignorar colunas nas posições de índice 1 e 2 ao importar o arquivo Excel chamado my_data.xlsx para o pandas.
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: ignorar colunas específicas ao importar um arquivo Excel para o Pandas
Digamos que temos o seguinte arquivo Excel chamado player_data.xlsx :
Podemos usar a seguinte sintaxe para importar este arquivo para um DataFrame do pandas e ignorar as colunas nas posições de índice 1 e 2 (as colunas de ponto e salto) durante a importação:
#define columns to skip skip_cols = [1, 2] #define columns to keep keep_cols = [i for i in range (4) if i not in skip_cols] #import Excel file and skip specific columns df = pd. read_excel (' player_data.xlsx ', usecols=keep_cols) #view DataFrame print (df) team assists 0 to 5 1 B 3 2 C 7 3 D 8 4 E 8 5 F 9
Observe que todas as colunas no arquivo Excel, exceto as colunas nas posições de índice 1 e 2 (as colunas de pontos e saltos), foram importadas para o DataFrame do pandas.
Observe que este método pressupõe que você saiba de antemão quantas colunas existem no arquivo Excel.
Como sabíamos que havia 4 colunas no total no arquivo, usamos range(4) para definir as colunas que queríamos manter.
Nota : Você pode encontrar a documentação completa da função read_excel() do pandas aqui .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:
Pandas: como pular linhas ao ler um arquivo Excel
Pandas: como especificar tipos ao importar um arquivo Excel
Pandas: como combinar várias planilhas do Excel