Jak czytać plik csv bez nagłówków w pandach (z przykładem)


Aby wczytać plik CSV bez nagłówków do ramki DataFrame pandy, możesz użyć następującej podstawowej składni:

 df = pd. read_csv (' my_data.csv ', header= None )

Argument header=None informuje pandy, że pierwsza linia nie powinna być używana jako linia nagłówka.

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Przeczytaj plik CSV bez nagłówków w Pandach

Załóżmy, że mamy następujący plik CSV o nazwie Players_data.csv :

pandy czytają plik CSV bez nagłówków

Z pliku widzimy, że pierwszy wiersz nie zawiera nazw kolumn.

Jeśli zaimportujemy plik CSV za pomocą funkcji read_csv() , pandy spróbują użyć pierwszej linii jako linii nagłówka:

 import pandas as pd

#import CSV file
df = pd. read_csv (' players_data.csv ')

#view resulting DataFrame
print (df)

   At 22 10
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

Możemy jednak określić header=None , aby pandy wiedziały, że nie należy używać pierwszego wiersza jako wiersza nagłówka:

 import pandas as pd

#import CSV file without header
df = pd. read_csv (' players_data.csv ', header = None )

#view resulting DataFrame
print (df)

   0 1 2
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

Należy pamiętać, że pierwsza linia pliku CSV nie jest już używana jako linia nagłówka.

Należy również pamiętać, że pandy domyślnie używają zakresu wartości numerycznych (0, 1, 2) jako nazw kolumn.

Aby określić własne nazwy kolumn podczas importowania pliku CSV, możesz użyć argumentu nazwy w następujący sposób:

 import pandas as pd

#specify column names
cols = [' team ', ' points ', ' rebounds ']

#import CSV file without header and specify column names
df = pd. read_csv (' players_data.csv ', header = None , names=cols)

#view resulting DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

DataFrame ma teraz nazwy kolumn, które określiliśmy za pomocą argumentu name .

Uwaga : pełną dokumentację funkcji pandy read_csv() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w Pythonie:

Pandy: Jak pominąć linie podczas czytania pliku CSV
Pandy: Jak dodać dane do istniejącego pliku CSV
Pandy: jak używać read_csv z argumentem usecols

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *