Pandas: como pular linhas ao ler um arquivo excel


Você pode usar os seguintes métodos para pular linhas ao ler um arquivo Excel em um DataFrame do pandas:

Método 1: pular uma linha específica

 #import DataFrame and skip row in index position 2
df = pd. read_excel (' my_data.xlsx ', skiprows=[ 2 ])

Método 2: ignorando várias linhas específicas

 #import DataFrame and skip rows in index positions 2 and 4
df = pd. read_excel (' my_data.xlsx ' , skiprows=[2,4 ] )

Método 3: ignore as primeiras N linhas

 #import DataFrame and skip first 2 rows
df = pd. read_excel (' my_data.xlsx ', skiprows= 2 )

Os exemplos a seguir mostram como usar cada método na prática com o seguinte arquivo Excel chamado player_data.xlsx :

Exemplo 1: ignorar uma linha específica

Podemos usar o seguinte código para importar o arquivo Excel e ignorar a linha na posição 2 do índice:

 import pandas as pd

#import DataFrame and skip row in index position 2
df = pd. read_excel (' player_data.xlsx ', skiprows=[ 2 ])

#view DataFrame
print (df)

  team points rebound assists
0 to 24 8 5
1 C 15 4 7
2 D 19 4 8
3 E 32 6 8
4 F 13 7 9

Observe que a linha na posição 2 do índice (com a equipe ‘B’) foi ignorada ao importar o arquivo Excel para o DataFrame do pandas.

Nota : A primeira linha do arquivo Excel é considerada a linha 0.

Exemplo 2: Ignorando várias linhas específicas

Podemos usar o seguinte código para importar o arquivo Excel e ignorar as linhas nas posições de índice 2 e 4:

 import pandas as pd

#import DataFrame and skip rows in index positions 2 and 4
df = pd. read_excel (' player_data.xlsx ', skiprows=[ 2,4 ] )

#view DataFrame
print (df)

  team points rebound assists
0 to 24 8 5
1 C 15 4 7
2 E 32 6 8
3 F 13 7 9

Observe que as linhas nas posições de índice 2 e 4 (com as equipes “B” e “D”) foram ignoradas ao importar o arquivo Excel para o DataFrame do pandas.

Exemplo 3: ignore as primeiras N linhas

Podemos usar o seguinte código para importar o arquivo Excel e ignorar as duas primeiras linhas:

 import pandas as pd

#import DataFrame and skip first 2 rows
df = pd. read_excel (' player_data.xlsx ', skiprows= 2 )

#view DataFrame
print (df)

   B 20 12 3
0 C 15 4 7
1 D 19 4 8
2 E 32 6 8
3 F 13 7 9

Observe que as duas primeiras linhas do arquivo Excel foram ignoradas e a próxima linha disponível (com a equipe “B”) tornou-se a linha de cabeçalho do DataFrame.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em Python:

Como ler arquivos Excel com Pandas
Como exportar Pandas DataFrame para Excel
Como exportar um array NumPy para um arquivo CSV

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *