Pandas: defina nomes de colunas ao importar um arquivo csv
Você pode usar a seguinte sintaxe básica para definir os nomes das colunas de um DataFrame ao importar um arquivo CSV para o pandas:
colnames = [' col1 ', ' col2 ', ' col3 '] df = pd. read_csv (' my_data.csv ', names=colnames)
O argumento de nomes leva uma lista de nomes que você deseja usar para as colunas no DataFrame.
Ao usar este argumento, você também está dizendo ao pandas para usar a primeira linha do arquivo CSV como a primeira linha do DataFrame em vez de usá-la como linha de cabeçalho.
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: definir nomes de colunas ao importar um arquivo CSV para o Pandas
Digamos que temos o seguinte arquivo CSV chamado Players_data.csv :
No arquivo podemos ver que a primeira linha não contém nenhum nome de coluna.
Se importarmos o arquivo CSV usando a função read_csv() , o pandas tentará usar os valores da primeira linha como nomes de colunas para o DataFrame:
import pandas as pd #import CSV file df = pd. read_csv (' players_data.csv ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10
No entanto, podemos usar o argumento de nomes para especificar nossos próprios nomes de colunas ao importar o arquivo CSV:
import pandas as pd #specify column names colnames = [' team ', ' points ', ' rebounds '] #import CSV file and use specified column names df = pd. read_csv (' players_data.csv ', names = colnames) #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Observe que a primeira linha do arquivo CSV não é mais usada como linha de cabeçalho.
Em vez disso, os nomes das colunas que especificamos usando o argumento de nomes agora são usados como nomes de colunas.
Nota : Você pode encontrar a documentação completa da função read_csv() do pandas aqui .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em Python:
Pandas: Como pular linhas ao ler um arquivo CSV
Pandas: como adicionar dados a um arquivo CSV existente
Pandas: como usar read_csv com argumento usecols