Pandas: ignore a primeira coluna ao importar um arquivo csv


Você pode usar a seguinte sintaxe básica para ignorar a primeira coluna ao importar um arquivo CSV para um DataFrame do pandas:

 with open (' basketball_data.csv ') as x:
    ncols = len ( x.readline (). split (' , '))

df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))

Este exemplo específico lerá cada coluna de um arquivo CSV chamado basquete_data.csv em um DataFrame do pandas, exceto a primeira coluna.

Usando este código, primeiro encontramos o número de colunas no arquivo CSV e o atribuímos a uma variável chamada ncols .

A seguir, usamos o argumento usecols para especificar que queremos importar apenas as colunas entre 1 (ou seja, a segunda coluna) e a última coluna do arquivo CSV.

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: Ignore a primeira coluna ao importar um arquivo CSV para o Pandas

Digamos que temos o seguinte arquivo CSV chamado basket_data.csv :

Podemos usar a seguinte sintaxe para importar o arquivo CSV para um DataFrame do pandas e ignorar a primeira coluna:

 import pandas as pd

#calculate number of columns in CSV file
with open (' basketball_data.csv ') as x:
    ncols = len ( x.readline (). split (' , '))

#import all columns except first column into DataFrame
df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))

#view resulting DataFrame
print (df)

   rebound points
0 22 10
1 14 9
2 29 6
3 30 2

Observe que a primeira coluna chamada team foi removida quando importamos o arquivo CSV para o pandas.

Observe que se você já conhece antecipadamente o número total de colunas no arquivo CSV, pode fornecer esse valor diretamente ao argumento usecols .

Por exemplo, suponha que já sabemos que existem três colunas no arquivo CVS.

Poderíamos usar a seguinte sintaxe para importar o arquivo CSV para um DataFrame do pandas e ignorar a primeira coluna:

 import pandas as pd

#import all columns except first column into DataFrame
df = pd. read_csv (' basketball_data.csv ', usecols= range (1,3))

#view resulting DataFrame
print (df)

   rebound points
0 22 10
1 14 9
2 29 6
3 30 2

Observe que a primeira coluna chamada team foi removida quando importamos o arquivo CSV para o pandas.

Como já sabíamos que havia três colunas no arquivo CSV, simplesmente usamos range(1,3) no argumento usecols .

Nota : Você pode encontrar a documentação completa da função read_csv() do pandas aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em Python:

Pandas: Como pular linhas ao ler um arquivo CSV
Pandas: como adicionar dados a um arquivo CSV existente
Pandas: como usar read_csv com argumento usecols

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *