Dosyaları daha hızlı içe aktarmak için r'de fread() nasıl kullanılır?


Dosyaları hızlı ve kolay bir şekilde içe aktarmak için R’deki data.table paketinin fread() işlevini kullanabilirsiniz.

Bu işlev aşağıdaki temel sözdizimini kullanır:

 library (data.table)

df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ")

Büyük dosyalar için bu işlevin, R tabanındaki read.csv gibi işlevlerden önemli ölçüde daha hızlı olduğu bulundu.

Çoğu durumda bu işlev, içe aktardığınız veri kümesine ilişkin sınırlayıcı ve sütun türlerini de otomatik olarak algılayabilir.

Aşağıdaki örnekte bu fonksiyonun pratikte nasıl kullanılacağı gösterilmektedir.

Örnek: Dosyaları R’ye aktarmak için feed() nasıl kullanılır?

Diyelim ki aşağıdaki konuma kaydedilmiş data.csv adında bir CSV dosyam var:

C:\Kullanıcılar\Bob\Masaüstü\data.csv

CSV dosyasının aşağıdaki verileri içerdiğini varsayalım:

 team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

Bu dosyayı mevcut R ortamıma aktarmak için data.table paketinin fread() işlevini kullanabilirim:

 library (data.table)

#import data
df <- fread("C:\Users\Bob\Desktop\data.csv")

#viewdata
df

  team points assists
1 A 78 12
2 B 85 20
3 C 93 23
4 D 90 8
5 E 91 14

Fread() fonksiyonunu kullanarak CSV dosyasını başarılı bir şekilde içe aktarabiliyoruz.

Not : Yaygın bir içe aktarma hatasından kaçınmak için dosya yolunda çift ters eğik çizgi (\\) kullandık.

Fread() işlevi bunun virgül olduğunu otomatik olarak algıladığından sınırlayıcıyı belirtmemize de gerek olmadığını unutmayın.

Veri çerçevesinin yapısını görüntülemek için str() fonksiyonunu kullanırsak, fread() fonksiyonunun ayrıca her sütun için nesne tipini otomatik olarak tanımladığını görebiliriz:

 #view structure of data
str(df)

Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Sonuçtan şunu görebiliriz:

  • Takım değişkeni bir karakterdir.
  • Puan değişkeni bir tamsayıdır.
  • Yardımcı değişken bir tamsayıdır.

Bu örnekte basitlik açısından küçük bir veri çerçevesi kullandık (5 satır x 3 sütun), ancak pratikte fread() işlevi onbinlerce satır içeren veri bloklarını hızlı ve verimli bir şekilde içe aktarabiliyor, bu da onu tercih edilen içe aktarma yöntemi yapıyor büyük ölçekli veri kümeleri için.

Ek kaynaklar

Aşağıdaki eğitimlerde belirli dosya türlerinin R’ye nasıl aktarılacağı açıklanmaktadır:

Excel dosyaları R’ye nasıl aktarılır
TSV dosyaları R’ye nasıl aktarılır
Zip dosyaları R’ye nasıl aktarılır
SAS dosyaları R’ye nasıl aktarılır
.dta dosyaları R’ye nasıl aktarılır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir