Panda: ignora colonne specifiche durante l'importazione di un file excel
È possibile utilizzare la seguente sintassi di base per ignorare colonne specifiche quando si importa un file Excel in un DataFrame panda:
#define columns to skip skip_cols = [1, 2] #define columns to keep keep_cols = [i for i in range (4) if i not in skip_cols] #import Excel file and skip specific columns df = pd. read_excel (' my_data.xlsx ', usecols=keep_cols)
Questo particolare esempio ignorerà le colonne nelle posizioni dell’indice 1 e 2 durante l’importazione del file Excel denominato my_data.xlsx in panda.
L’esempio seguente mostra come utilizzare questa sintassi nella pratica.
Esempio: ignora colonne specifiche quando importi un file Excel in Pandas
Diciamo che abbiamo il seguente file Excel chiamato player_data.xlsx :
Possiamo utilizzare la seguente sintassi per importare questo file in un DataFrame panda e ignorare le colonne nelle posizioni dell’indice 1 e 2 (le colonne punto e rimbalzo) durante l’importazione:
#define columns to skip skip_cols = [1, 2] #define columns to keep keep_cols = [i for i in range (4) if i not in skip_cols] #import Excel file and skip specific columns df = pd. read_excel (' player_data.xlsx ', usecols=keep_cols) #view DataFrame print (df) team assists 0 to 5 1 B 3 2 C 7 3 D 8 4 E 8 5 F 9
Tieni presente che tutte le colonne nel file Excel, tranne le colonne nelle posizioni dell’indice 1 e 2 (le colonne punti e rimbalzi) sono state importate nel DataFrame panda.
Tieni presente che questo metodo presuppone che tu sappia in anticipo quante colonne sono presenti nel file Excel.
Poiché sapevamo che nel file c’erano 4 colonne in totale, abbiamo utilizzato range(4) per definire le colonne che volevamo mantenere.
Nota : puoi trovare la documentazione completa della funzione panda read_excel() qui .
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:
Panda: come saltare le righe durante la lettura di un file Excel
Panda: come specificare i tipi durante l’importazione di un file Excel
Panda: come combinare più fogli Excel