Pandas: como pular linhas ao ler um arquivo csv


Você pode usar os seguintes métodos para pular linhas ao ler um arquivo CSV em um DataFrame do pandas:

Método 1: pular uma linha específica

 #import DataFrame and skip 2nd row
df = pd. read_csv ('my_data.csv', skiprows=[ 2 ])

Método 2: ignorando várias linhas específicas

 #import DataFrame and skip 2nd and 4th row
df = pd. read_csv (' my_data.csv', skiprows=[2,4 ] )

Método 3: ignore as primeiras N linhas

 #import DataFrame and skip first 2 rows
df = pd. read_csv ('my_data.csv', skiprows= 2 )

Os exemplos a seguir mostram como usar cada método na prática com o seguinte arquivo CSV chamado basket_data.csv :

Exemplo 1: ignorar uma linha específica

Podemos usar o seguinte código para importar o arquivo CSV e ignorar a segunda linha:

 import pandas as pd

#import DataFrame and skip 2nd row
df = pd. read_csv ('basketball_data.csv', skiprows=[ 2 ])

#view DataFrame
df

        team points rebounds
0 to 22 10
1 C 29 6
2 D 30 2

Observe que a segunda linha (com equipe “B”) foi ignorada ao importar o arquivo CSV para o DataFrame do pandas.

Nota : A primeira linha do arquivo CSV é considerada a linha 0.

Exemplo 2: Ignorando várias linhas específicas

Podemos usar o seguinte código para importar o arquivo CSV e pular a segunda e quarta linhas:

 import pandas as pd

#import DataFrame and skip 2nd and 4th rows
df = pd. read_csv ('basketball_data.csv', skiprows=[ 2 , 4 ])

#view DataFrame
df

        team points rebounds
0 to 22 10
1 C 29 6

Observe que a segunda e a quarta linhas (com as equipes “B” e “D”) foram ignoradas ao importar o arquivo CSV para o DataFrame do pandas.

Exemplo 3: ignore as primeiras N linhas

Podemos usar o seguinte código para importar o arquivo CSV e pular as duas primeiras linhas:

 import pandas as pd

#import DataFrame and skip first 2 rows
df = pd. read_csv ('basketball_data.csv', skiprows= 2 )

#view DataFrame
df

        B 14 9
0 C 29 6
1 D 30 2

Observe que as duas primeiras linhas do arquivo CSV foram ignoradas e a próxima linha disponível (com o time “B”) tornou-se a linha de cabeçalho do DataFrame.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em Python:

Como ler arquivos Excel com Pandas
Como exportar Pandas DataFrame para Excel
Como exportar um array NumPy para um arquivo CSV

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *