Jak czytać plik csv bez nagłówków w pandach (z przykładem)
Aby wczytać plik CSV bez nagłówków do ramki DataFrame pandy, możesz użyć następującej podstawowej składni:
df = pd. read_csv (' my_data.csv ', header= None )
Argument header=None informuje pandy, że pierwsza linia nie powinna być używana jako linia nagłówka.
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Przeczytaj plik CSV bez nagłówków w Pandach
Załóżmy, że mamy następujący plik CSV o nazwie Players_data.csv :
Z pliku widzimy, że pierwszy wiersz nie zawiera nazw kolumn.
Jeśli zaimportujemy plik CSV za pomocą funkcji read_csv() , pandy spróbują użyć pierwszej linii jako linii nagłówka:
import pandas as pd #import CSV file df = pd. read_csv (' players_data.csv ') #view resulting DataFrame print (df) At 22 10 0 B 14 9 1 C 29 6 2 D 30 2 3 E 22 9 4 F 31 10
Możemy jednak określić header=None , aby pandy wiedziały, że nie należy używać pierwszego wiersza jako wiersza nagłówka:
import pandas as pd #import CSV file without header df = pd. read_csv (' players_data.csv ', header = None ) #view resulting DataFrame print (df) 0 1 2 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
Należy pamiętać, że pierwsza linia pliku CSV nie jest już używana jako linia nagłówka.
Należy również pamiętać, że pandy domyślnie używają zakresu wartości numerycznych (0, 1, 2) jako nazw kolumn.
Aby określić własne nazwy kolumn podczas importowania pliku CSV, możesz użyć argumentu nazwy w następujący sposób:
import pandas as pd #specify column names cols = [' team ', ' points ', ' rebounds '] #import CSV file without header and specify column names df = pd. read_csv (' players_data.csv ', header = None , names=cols) #view resulting DataFrame print (df) team points rebounds 0 to 22 10 1 B 14 9 2 C 29 6 3 D 30 2 4 E 22 9 5 F 31 10
DataFrame ma teraz nazwy kolumn, które określiliśmy za pomocą argumentu name .
Uwaga : pełną dokumentację funkcji pandy read_csv() można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w Pythonie:
Pandy: Jak pominąć linie podczas czytania pliku CSV
Pandy: Jak dodać dane do istniejącego pliku CSV
Pandy: jak używać read_csv z argumentem usecols