Come leggere csv senza intestazioni in panda (con esempio)


È possibile utilizzare la seguente sintassi di base per leggere un file CSV senza intestazioni in un DataFrame panda:

 df = pd. read_csv (' my_data.csv ', header= None )

L’argomento header=None dice ai panda che la prima riga non deve essere utilizzata come riga di intestazione.

L’esempio seguente mostra come utilizzare questa sintassi nella pratica.

Esempio: leggere un file CSV senza intestazioni in Panda

Supponiamo di avere il seguente file CSV chiamato Players_data.csv :

i panda leggono il file CSV senza intestazioni

Dal file possiamo vedere che la prima riga non contiene nomi di colonne.

Se importiamo il file CSV utilizzando la funzione read_csv() , i panda proveranno a utilizzare la prima riga come riga di intestazione:

 import pandas as pd

#import CSV file
df = pd. read_csv (' players_data.csv ')

#view resulting DataFrame
print (df)

   At 22 10
0 B 14 9
1 C 29 6
2 D 30 2
3 E 22 9
4 F 31 10

Tuttavia, possiamo specificare header=None in modo che i panda sappiano di non utilizzare la prima riga come riga di intestazione:

 import pandas as pd

#import CSV file without header
df = pd. read_csv (' players_data.csv ', header = None )

#view resulting DataFrame
print (df)

   0 1 2
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

Tieni presente che la prima riga del file CSV non viene più utilizzata come riga di intestazione.

Tieni inoltre presente che panda utilizza un intervallo di valori numerici (0, 1, 2) come nomi di colonna per impostazione predefinita.

Per specificare i nomi delle colonne personalizzate durante l’importazione del file CSV, è possibile utilizzare l’argomento dei nomi come segue:

 import pandas as pd

#specify column names
cols = [' team ', ' points ', ' rebounds ']

#import CSV file without header and specify column names
df = pd. read_csv (' players_data.csv ', header = None , names=cols)

#view resulting DataFrame
print (df)

  team points rebounds
0 to 22 10
1 B 14 9
2 C 29 6
3 D 30 2
4 E 22 9
5 F 31 10

Il DataFrame ora ha i nomi delle colonne che abbiamo specificato utilizzando l’argomento dei nomi .

Nota : puoi trovare la documentazione completa della funzione panda read_csv() qui .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in Python:

Panda: come saltare le righe durante la lettura di un file CSV
Panda: come aggiungere dati a un file CSV esistente
Panda: come usare read_csv con argomento usecols

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *