Pandas: como ler apenas linhas específicas de um arquivo csv
Você pode usar a seguinte sintaxe básica para ler apenas linhas específicas de um arquivo CSV em um DataFrame do pandas:
#specify rows to import
specific_rows = [ 0 , 2 , 3 ]
#import specific rows from CSV into DataFrame
df = pd. read_csv (' my_data.csv ', skiprows = lambda x:x not in specific_rows)
Este exemplo específico lerá linhas nas posições de índice 0, 2 e 3 de um arquivo CSV chamado my_data.csv em um DataFrame do pandas.
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: leia apenas linhas específicas de um arquivo CSV no Pandas
Digamos que temos o seguinte arquivo CSV chamado basket_data.csv :
Se usarmos a função read_csv() , o pandas importará automaticamente cada linha do arquivo CSV para um DataFrame:
import pandas as pd #import all rows of CSV into DataFrame df = pd. read_csv (' basketball_data.csv ') #view DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2
No entanto, podemos usar a seguinte sintaxe para importar apenas as linhas nas posições de índice 0, 2 e 3 do arquivo CSV para um DataFrame do pandas:
import pandas as pd #specify rows to import specific_rows = [ 0 , 2 , 3 ] #import specific rows from CSV into DataFrame df = pd. read_csv (' basketball_data.csv ', skiprows = lambda x:x not in specific_rows) #view DataFrame print (df) team points rebounds 0 B 14 9 1 C 29 6
Observe que apenas as linhas nas posições de índice 0, 2 e 3 do arquivo CSV são importadas para o DataFrame.
Esta sintaxe usa o argumento skiprows e uma função lambda para informar ao pandas quais linhas não devem ser ignoradas ao importar o arquivo CSV.
Neste exemplo, estamos dizendo ao pandas para não ignorar as linhas nas posições de índice 0, 2 e 3, mas para ignorar todas as outras linhas ao importar o arquivo CSV.
Nota : Você pode encontrar a documentação completa da função read_csv() do pandas aqui .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em Python:
Pandas: Como pular linhas ao ler um arquivo CSV
Pandas: como adicionar dados a um arquivo CSV existente
Pandas: como especificar tipos ao importar um arquivo CSV
Pandas: Como definir nomes de colunas ao importar um arquivo CSV