Panduan utama: cara membaca file csv dengan pandas


File CSV (nilai dipisahkan koma) adalah salah satu cara paling umum untuk menyimpan data.

Untungnya, fungsi pandas read_csv() memungkinkan Anda membaca file CSV dengan mudah dengan Python dalam hampir semua format yang Anda inginkan.

Tutorial ini menjelaskan beberapa cara membaca file CSV dengan Python menggunakan file CSV berikut bernama “data.csv” :

 playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22

Contoh 1: Baca file CSV ke dalam pandas DataFrame

Kode berikut menunjukkan cara membaca file CSV ke dalam pandas DataFrame:

 #import CSV file as DataFrame
df = pd. read_csv ('data.csv')

#view DataFrame
df

        playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

Contoh 2: Membaca kolom tertentu dari file CSV

Kode berikut menunjukkan cara membaca hanya kolom berlabel “playerID” dan “points” dari file CSV ke dalam pandas DataFrame:

 #import only specific columns from CSV file
df = pd. read_csv ('data.csv', usecols=[' playerID ',' points '])

#view DataFrame
df

	playerID points
0 1 26
1 2 19
2 3 24
3 4 22

Anda juga dapat menentukan indeks kolom untuk dibaca ke dalam DataFrame pandas:

 #import only specific columns from CSV file
df = pd. read_csv (' data.csv ', usecols=[ 0,1 ])

#view DataFrame
df

        playerID team
0 1 Lakers
1 2 Mavs
2 3 Bucks
3 4 Spurs

Contoh 3: Tentukan baris header saat mengimpor file CSV

Dalam beberapa kasus, baris header mungkin bukan baris pertama dalam file CSV.

Misalnya, perhatikan file CSV berikut yang baris headernya sebenarnya muncul di baris kedua:

 random,data,values
playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22

Untuk membaca file CSV ini ke dalam pandas DataFrame, kita dapat menentukan header=1 sebagai berikut:

 #import from CSV file and specify that header starts on second row
df = pd. read_csv ('data.csv', header= 1 )

#view DataFrame
df

        playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

Contoh 4: Lewati baris saat mengimpor file CSV

Anda juga dapat dengan mudah melewati baris saat mengimpor file CSV dengan menggunakan argumen skiprows .

Misalnya, kode berikut menunjukkan cara mengabaikan baris kedua saat mengimpor file CSV:

 #import from CSV file and skip second row
df = pd. read_csv ('data.csv', skiprows=[ 1 ] )

#view DataFrame
df

        playerID team points
0 2 Mavs 19
1 3 Bucks 24
2 4 Spurs 22

Dan kode berikut menunjukkan cara mengabaikan baris kedua dan ketiga saat mengimpor file CSV:

 #import from CSV file and skip second and third rows
df = pd. read_csv ('data.csv', skiprows=[ 1,2 ] )

#view DataFrame
df

        playerID team points
1 3 Bucks 24
2 4 Spurs 22

Contoh 5: Membaca file CSV dengan pembatas khusus

Terkadang Anda mungkin memiliki file CSV dengan pembatas selain koma.

Misalnya, file CSV kita memiliki garis bawah sebagai pembatas:

 playerID_team_points
1_Lakers_26
2_Mavs_19
3_Bucks_24
4_Spurs_22

Untuk membaca file CSV ini ke dalam pandas, kita dapat menggunakan argumen sep untuk menentukan pembatas yang akan digunakan saat membaca file:

 #import from CSV file and specify delimiter to use
df = pd. read_csv ('data.csv', sep=' _ ')

#view DataFrame
df

	playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas panda umum lainnya:

Cara membaca file teks dengan Pandas
Cara membaca file Excel dengan Pandas
Cara membaca file TSV dengan Pandas
Cara membaca tabel HTML dengan Pandas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *