Pandy: ustaw nazwy kolumn podczas importowania pliku csv
Możesz użyć następującej podstawowej składni, aby zdefiniować nazwy kolumn ramki DataFrame podczas importowania pliku CSV do pand:
colnames = [' col1 ', ' col2 ', ' col3 '] df = pd. read_csv (' my_data.csv ', names=colnames)
Argument nazwy pobiera listę nazw, których chcesz użyć w kolumnach w ramce DataFrame.
Używając tego argumentu, mówisz także pandom, aby użyły pierwszej linii pliku CSV jako pierwszej linii ramki danych zamiast używać jej jako linii nagłówka.
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Ustaw nazwy kolumn podczas importowania pliku CSV do Pand
Załóżmy, że mamy następujący plik CSV o nazwie Players_data.csv :
Z pliku widzimy, że pierwszy wiersz nie zawiera nazw kolumn.
Jeśli zaimportujemy plik CSV za pomocą funkcji read_csv() , pandy spróbują użyć wartości z pierwszego wiersza jako nazw kolumn dla DataFrame:
import pandas as pd #import CSV file df = pd. read_csv (' players_data.csv ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10
Możemy jednak użyć argumentu nazwy , aby określić własne nazwy kolumn podczas importowania pliku CSV:
import pandas as pd #specify column names colnames = [' team ', ' points ', ' rebounds '] #import CSV file and use specified column names df = pd. read_csv (' players_data.csv ', names = colnames) #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Należy pamiętać, że pierwsza linia pliku CSV nie jest już używana jako linia nagłówka.
Zamiast tego nazwy kolumn, które określiliśmy za pomocą argumentu name , są teraz używane jako nazwy kolumn.
Uwaga : pełną dokumentację funkcji pandy read_csv() można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w Pythonie:
Pandy: Jak pominąć linie podczas czytania pliku CSV
Pandy: Jak dodać dane do istniejącego pliku CSV
Pandy: jak używać read_csv z argumentem usecols