Pandas: como ler apenas linhas específicas de um arquivo csv


Você pode usar a seguinte sintaxe básica para ler apenas linhas específicas de um arquivo CSV em um DataFrame do pandas:

 #specify rows to import
specific_rows = [ 0 , 2 , 3 ]

#import specific rows from CSV into DataFrame
df = pd. read_csv (' my_data.csv ', skiprows = lambda x:x not in specific_rows)

Este exemplo específico lerá linhas nas posições de índice 0, 2 e 3 de um arquivo CSV chamado my_data.csv em um DataFrame do pandas.

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: leia apenas linhas específicas de um arquivo CSV no Pandas

Digamos que temos o seguinte arquivo CSV chamado basket_data.csv :

Se usarmos a função read_csv() , o pandas importará automaticamente cada linha do arquivo CSV para um DataFrame:

 import pandas as pd

#import all rows of CSV into DataFrame
df = pd. read_csv (' basketball_data.csv ')

#view DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2

No entanto, podemos usar a seguinte sintaxe para importar apenas as linhas nas posições de índice 0, 2 e 3 do arquivo CSV para um DataFrame do pandas:

 import pandas as pd

#specify rows to import
specific_rows = [ 0 , 2 , 3 ]

#import specific rows from CSV into DataFrame
df = pd. read_csv (' basketball_data.csv ', skiprows = lambda x:x not in specific_rows)

#view DataFrame
print (df)

  team points rebounds
0 B 14 9
1 C 29 6

Observe que apenas as linhas nas posições de índice 0, 2 e 3 do arquivo CSV são importadas para o DataFrame.

Esta sintaxe usa o argumento skiprows e uma função lambda para informar ao pandas quais linhas não devem ser ignoradas ao importar o arquivo CSV.

Neste exemplo, estamos dizendo ao pandas para não ignorar as linhas nas posições de índice 0, 2 e 3, mas para ignorar todas as outras linhas ao importar o arquivo CSV.

Nota : Você pode encontrar a documentação completa da função read_csv() do pandas aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em Python:

Pandas: Como pular linhas ao ler um arquivo CSV
Pandas: como adicionar dados a um arquivo CSV existente
Pandas: como especificar tipos ao importar um arquivo CSV
Pandas: Como definir nomes de colunas ao importar um arquivo CSV

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *