Panduan utama: cara membaca file csv dengan pandas
File CSV (nilai dipisahkan koma) adalah salah satu cara paling umum untuk menyimpan data.
Untungnya, fungsi pandas read_csv() memungkinkan Anda membaca file CSV dengan mudah dengan Python dalam hampir semua format yang Anda inginkan.
Tutorial ini menjelaskan beberapa cara membaca file CSV dengan Python menggunakan file CSV berikut bernama “data.csv” :
playerID,team,points 1,Lakers,26 2,Mavs,19 3,Bucks,24 4,Spurs,22
Contoh 1: Baca file CSV ke dalam pandas DataFrame
Kode berikut menunjukkan cara membaca file CSV ke dalam pandas DataFrame:
#import CSV file as DataFrame df = pd. read_csv ('data.csv') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
Contoh 2: Membaca kolom tertentu dari file CSV
Kode berikut menunjukkan cara membaca hanya kolom berlabel “playerID” dan “points” dari file CSV ke dalam pandas DataFrame:
#import only specific columns from CSV file df = pd. read_csv ('data.csv', usecols=[' playerID ',' points ']) #view DataFrame df playerID points 0 1 26 1 2 19 2 3 24 3 4 22
Anda juga dapat menentukan indeks kolom untuk dibaca ke dalam DataFrame pandas:
#import only specific columns from CSV file df = pd. read_csv (' data.csv ', usecols=[ 0,1 ]) #view DataFrame df playerID team 0 1 Lakers 1 2 Mavs 2 3 Bucks 3 4 Spurs
Contoh 3: Tentukan baris header saat mengimpor file CSV
Dalam beberapa kasus, baris header mungkin bukan baris pertama dalam file CSV.
Misalnya, perhatikan file CSV berikut yang baris headernya sebenarnya muncul di baris kedua:
random,data,values
playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22
Untuk membaca file CSV ini ke dalam pandas DataFrame, kita dapat menentukan header=1 sebagai berikut:
#import from CSV file and specify that header starts on second row df = pd. read_csv ('data.csv', header= 1 ) #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
Contoh 4: Lewati baris saat mengimpor file CSV
Anda juga dapat dengan mudah melewati baris saat mengimpor file CSV dengan menggunakan argumen skiprows .
Misalnya, kode berikut menunjukkan cara mengabaikan baris kedua saat mengimpor file CSV:
#import from CSV file and skip second row df = pd. read_csv ('data.csv', skiprows=[ 1 ] ) #view DataFrame df playerID team points 0 2 Mavs 19 1 3 Bucks 24 2 4 Spurs 22
Dan kode berikut menunjukkan cara mengabaikan baris kedua dan ketiga saat mengimpor file CSV:
#import from CSV file and skip second and third rows df = pd. read_csv ('data.csv', skiprows=[ 1,2 ] ) #view DataFrame df playerID team points 1 3 Bucks 24 2 4 Spurs 22
Contoh 5: Membaca file CSV dengan pembatas khusus
Terkadang Anda mungkin memiliki file CSV dengan pembatas selain koma.
Misalnya, file CSV kita memiliki garis bawah sebagai pembatas:
playerID_team_points
1_Lakers_26
2_Mavs_19
3_Bucks_24
4_Spurs_22
Untuk membaca file CSV ini ke dalam pandas, kita dapat menggunakan argumen sep untuk menentukan pembatas yang akan digunakan saat membaca file:
#import from CSV file and specify delimiter to use df = pd. read_csv ('data.csv', sep=' _ ') #view DataFrame df playerID team points 0 1 Lakers 26 1 2 Mavs 19 2 3 Bucks 24 3 4 Spurs 22
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas panda umum lainnya:
Cara membaca file teks dengan Pandas
Cara membaca file Excel dengan Pandas
Cara membaca file TSV dengan Pandas
Cara membaca tabel HTML dengan Pandas