Pandas: abaikan kolom tertentu saat mengimpor file excel
Anda dapat menggunakan sintaks dasar berikut untuk mengabaikan kolom tertentu saat mengimpor file Excel ke pandas DataFrame:
#define columns to skip skip_cols = [1, 2] #define columns to keep keep_cols = [i for i in range (4) if i not in skip_cols] #import Excel file and skip specific columns df = pd. read_excel (' my_data.xlsx ', usecols=keep_cols)
Contoh khusus ini akan mengabaikan kolom di posisi indeks 1 dan 2 saat mengimpor file Excel bernama my_data.xlsx ke dalam panda.
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh: Abaikan kolom tertentu saat mengimpor file Excel ke Pandas
Katakanlah kita memiliki file Excel berikut bernama player_data.xlsx :
Kita dapat menggunakan sintaks berikut untuk mengimpor file ini ke dalam pandas DataFrame dan mengabaikan kolom di posisi indeks 1 dan 2 (kolom titik dan pantulan) selama impor:
#define columns to skip skip_cols = [1, 2] #define columns to keep keep_cols = [i for i in range (4) if i not in skip_cols] #import Excel file and skip specific columns df = pd. read_excel (' player_data.xlsx ', usecols=keep_cols) #view DataFrame print (df) team assists 0 to 5 1 B 3 2 C 7 3 D 8 4 E 8 5 F 9
Perhatikan bahwa semua kolom dalam file Excel kecuali kolom pada posisi indeks 1 dan 2 (kolom titik dan pantulan) telah diimpor ke pandas DataFrame.
Perhatikan bahwa metode ini mengasumsikan bahwa Anda mengetahui sebelumnya berapa banyak kolom dalam file Excel.
Karena kami tahu ada total 4 kolom dalam file, kami menggunakan range(4) untuk menentukan kolom yang ingin kami pertahankan.
Catatan : Anda dapat menemukan dokumentasi lengkap fungsi pandas read_excel() di sini .
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:
Pandas: Cara melewati baris saat membaca file Excel
Pandas: Cara menentukan tipe saat mengimpor file Excel
Pandas: Cara menggabungkan beberapa lembar Excel