Cara menggunakan fread() di r untuk mengimpor file lebih cepat


Anda dapat menggunakan fungsi fread() dari paket data.table di R untuk mengimpor file dengan cepat dan mudah.

Fungsi ini menggunakan sintaks dasar berikut:

 library (data.table)

df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ")

Untuk file berukuran besar, fungsi ini ternyata jauh lebih cepat dibandingkan fungsi seperti read.csv dari basis R.

Dan dalam kebanyakan kasus, fungsi ini juga dapat secara otomatis mendeteksi tipe pembatas dan kolom untuk kumpulan data yang Anda impor.

Contoh berikut menunjukkan cara menggunakan fungsi ini dalam praktiknya.

Contoh: Cara menggunakan feed() untuk mengimpor file ke R

Katakanlah saya memiliki file CSV bernama data.csv yang disimpan di lokasi berikut:

C:\Users\Bob\Desktop\data.csv

Dan asumsikan file CSV berisi data berikut:

 team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

Saya dapat menggunakan fungsi fread() dari paket data.table untuk mengimpor file ini ke lingkungan R saya saat ini:

 library (data.table)

#import data
df <- fread("C:\Users\Bob\Desktop\data.csv")

#viewdata
df

  team points assists
1 A 78 12
2 B 85 20
3 C 93 23
4 D 90 8
5 E 91 14

Kami berhasil mengimpor file CSV menggunakan fungsi fread() .

Catatan : Kami menggunakan garis miring terbalik ganda (\\) di jalur file untuk menghindari kesalahan impor yang umum .

Perhatikan bahwa kita juga tidak perlu menentukan pembatas karena fungsi fread() secara otomatis mendeteksi bahwa itu adalah koma.

Jika kita menggunakan fungsi str() untuk menampilkan struktur bingkai data, kita dapat melihat bahwa fungsi fread() juga secara otomatis mengidentifikasi tipe objek untuk setiap kolom:

 #view structure of data
str(df)

Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Dari hasilnya kita dapat melihat:

  • Variabel tim adalah karakter.
  • Variabel poin adalah bilangan bulat.
  • Variabel pembantunya adalah bilangan bulat.

Dalam contoh ini, kami menggunakan bingkai data kecil untuk kesederhanaan (5 baris x 3 kolom), namun dalam praktiknya fungsi fread() mampu dengan cepat dan efisien mengimpor blok data yang berisi puluhan ribu baris, menjadikannya metode impor pilihan untuk kumpulan data skala besar.

Sumber daya tambahan

Tutorial berikut menjelaskan cara mengimpor jenis file tertentu ke R:

Cara mengimpor file Excel ke R
Cara mengimpor file TSV ke R
Cara mengimpor file Zip ke R
Cara mengimpor file SAS ke R
Cara mengimpor file .dta ke R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *