Panda: rimuovi una colonna specifica durante l'importazione di un file csv
È possibile utilizzare la seguente sintassi di base per rimuovere una colonna specifica quando si importa un file CSV in un DataFrame panda:
df = pd. read_csv (' basketball_data.csv ', usecols= lambda x:x != ' rebounds ')
Questo particolare esempio leggerà ogni colonna da un file CSV chiamato basket_data.csv in un DataFrame panda, ad eccezione della colonna chiamata rebounds .
L’esempio seguente mostra come utilizzare questa sintassi nella pratica.
Esempio: rimuovere una colonna specifica durante l’importazione di un file CSV in Pandas
Supponiamo di avere il seguente file CSV chiamato basket_data.csv :
Possiamo utilizzare la seguente sintassi per importare il file CSV in panda e rimuovere la colonna chiamata rimbalzi durante l’importazione:
import pandas as pd #import all columns except 'rebounds' into DataFrame df = pd. read_csv (' basketball_data.csv ', usecols= lambda x:x != ' rebounds ') #view resulting DataFrame print (df) team points 0 to 22 1 B 14 2 C 29 3 D 30
Tieni presente che la colonna dei rimbalzi è stata rimossa quando abbiamo importato il file CSV in Pandas.
Se desideri rimuovere più colonne durante l’importazione, puoi utilizzare l’operatore not in come segue:
import pandas as pd #import all columns except 'team' and 'rebounds' into DataFrame df=pd. read_csv (' basketball_data.csv ', usecols= lambda x:x not in [' team ', ' rebounds ']) #view resulting DataFrame print (df) points 0 22 1 14 2 29 3 30
Tieni presente che le colonne della squadra e dei rimbalzi sono state entrambe rimosse quando abbiamo importato il file CSV in Pandas.
Tieni presente che puoi includere tutti i nomi di colonne che desideri nell’elenco seguendo l’operatore not in per rimuovere tutte le colonne che desideri durante l’importazione di un file CSV.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in Python:
Panda: come saltare le righe durante la lettura di un file CSV
Panda: come aggiungere dati a un file CSV esistente
Panda: come usare read_csv con argomento usecols