Panda: ignora la prima colonna durante l'importazione di un file csv
È possibile utilizzare la seguente sintassi di base per ignorare la prima colonna quando si importa un file CSV in un DataFrame panda:
with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols))
Questo particolare esempio leggerà ogni colonna di un file CSV chiamato basket_data.csv in un DataFrame panda, tranne la prima colonna.
Utilizzando questo codice, troviamo innanzitutto il numero di colonne nel file CSV e lo assegniamo a una variabile chiamata ncols .
Successivamente, utilizziamo l’argomento usecols per specificare che vogliamo importare solo le colonne tra 1 (cioè la seconda colonna) e l’ultima colonna del file CSV.
L’esempio seguente mostra come utilizzare questa sintassi nella pratica.
Esempio: ignora la prima colonna quando importi un file CSV in Pandas
Supponiamo di avere il seguente file CSV chiamato basket_data.csv :
Possiamo utilizzare la seguente sintassi per importare il file CSV in un DataFrame panda e ignorare la prima colonna:
import pandas as pd #calculate number of columns in CSV file with open (' basketball_data.csv ') as x: ncols = len ( x.readline (). split (' , ')) #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,ncols)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
Tieni presente che la prima colonna denominata team è stata rimossa quando abbiamo importato il file CSV in Pandas.
Tieni presente che se conosci già in anticipo il numero totale di colonne nel file CSV, puoi fornire direttamente questo valore all’argomento usecols .
Ad esempio, supponiamo di sapere già che ci sono tre colonne nel file CVS.
Potremmo usare la seguente sintassi per importare il file CSV in un DataFrame panda e ignorare la prima colonna:
import pandas as pd #import all columns except first column into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= range (1,3)) #view resulting DataFrame print (df) rebound points 0 22 10 1 14 9 2 29 6 3 30 2
Tieni presente che la prima colonna denominata team è stata rimossa quando abbiamo importato il file CSV in Pandas.
Dato che sapevamo già che c’erano tre colonne nel file CSV, abbiamo semplicemente utilizzato range(1,3) nell’argomento usecols .
Nota : puoi trovare la documentazione completa della funzione panda read_csv() qui .
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in Python:
Panda: come saltare le righe durante la lettura di un file CSV
Panda: come aggiungere dati a un file CSV esistente
Panda: come usare read_csv con argomento usecols