Panduan utama: cara membaca file excel dengan pandas
File Excel adalah salah satu cara paling umum untuk menyimpan data. Untungnya, fungsi pandas read_excel() memudahkan membaca file Excel.
Tutorial ini menjelaskan beberapa cara membaca file Excel dengan Python menggunakan pandas.
Contoh 1: Membaca file Excel ke dalam pandas DataFrame
Misalkan kita memiliki file Excel berikut:
Kode berikut menunjukkan cara menggunakan fungsi read_excel() untuk mengimpor file Excel ini ke dalam pandas DataFrame:
import pandas as pd #import Excel file df = pd. read_excel ('data.xlsx') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
Contoh 2: Membaca file Excel dengan kolom indeks
Terkadang Anda mungkin juga memiliki file Excel yang salah satu kolomnya adalah kolom indeks:
Dalam hal ini, Anda dapat menggunakan index_col untuk memberi tahu panda kolom mana yang akan digunakan sebagai kolom indeks saat mengimpor:
import pandas as pd #import Excel file, specifying the index column df = pd. read_excel ('data.xlsx', index_col=' index ') #view DataFrame df playerID team points index 1 1 Lakers 26 2 2 Mavs 19 3 3 Bucks 24 4 4 Spurs 22
Contoh 3: Membaca file Excel menggunakan nama sheet
Anda juga dapat membaca nama sheet tertentu dari file Excel ke dalam pandas DataFrame. Misalnya, pertimbangkan file Excel berikut:
Untuk membaca sheet tertentu sebagai DataFrame pandas, Anda dapat menggunakan argumen sheet_name() :
import pandas as pd #import only second sheet df = pd. read_excel ('data.xlsx', sheet_name=' second sheet ') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
Kesalahan umum: menginstal xlrd
Saat Anda mencoba menggunakan fungsi read_excel() , Anda mungkin mengalami kesalahan berikut:
ImportError: Install xlrd >= 1.0.0 for Excel support
Dalam hal ini, Anda harus menginstal xlrd terlebih dahulu:
pip install xlrd
Setelah terinstal, Anda dapat menggunakan fungsi read_excel() .
Sumber daya tambahan
Cara membaca file CSV dengan Pandas
Cara mengekspor Pandas DataFrame ke Excel