Pandas: ignore a primeira coluna ao importar um arquivo csv
Você pode usar a seguinte sintaxe básica para ignorar a primeira coluna ao importar um arquivo CSV para um DataFrame do pandas:
with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))
Este exemplo específico lerá cada coluna de um arquivo CSV chamado basquete_data.csv em um DataFrame do pandas, exceto a primeira coluna.
Usando este código, primeiro encontramos o número de colunas no arquivo CSV e o atribuímos a uma variável chamada ncols .
A seguir, usamos o argumento usecols para especificar que queremos importar apenas as colunas entre 1 (ou seja, a segunda coluna) e a última coluna do arquivo CSV.
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: Ignore a primeira coluna ao importar um arquivo CSV para o Pandas
Digamos que temos o seguinte arquivo CSV chamado basket_data.csv :
Podemos usar a seguinte sintaxe para importar o arquivo CSV para um DataFrame do pandas e ignorar a primeira coluna:
import pandas as pd #calculate number of columns in CSV file with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
Observe que a primeira coluna chamada team foi removida quando importamos o arquivo CSV para o pandas.
Observe que se você já conhece antecipadamente o número total de colunas no arquivo CSV, pode fornecer esse valor diretamente ao argumento usecols .
Por exemplo, suponha que já sabemos que existem três colunas no arquivo CVS.
Poderíamos usar a seguinte sintaxe para importar o arquivo CSV para um DataFrame do pandas e ignorar a primeira coluna:
import pandas as pd #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,3)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
Observe que a primeira coluna chamada team foi removida quando importamos o arquivo CSV para o pandas.
Como já sabíamos que havia três colunas no arquivo CSV, simplesmente usamos range(1,3) no argumento usecols .
Nota : Você pode encontrar a documentação completa da função read_csv() do pandas aqui .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em Python:
Pandas: Como pular linhas ao ler um arquivo CSV
Pandas: como adicionar dados a um arquivo CSV existente
Pandas: como usar read_csv com argumento usecols