Jak używać fread() w r do szybszego importowania plików


Możesz użyć funkcji fread() pakietu data.table w R, aby szybko i łatwo importować pliki.

Ta funkcja wykorzystuje następującą podstawową składnię:

 library (data.table)

df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ")

W przypadku dużych plików ta funkcja okazała się znacznie szybsza niż funkcje takie jak read.csv z bazowego R.

W większości przypadków ta funkcja może również automatycznie wykryć typy ograniczników i kolumn dla importowanego zbioru danych.

Poniższy przykład pokazuje, jak w praktyce wykorzystać tę funkcję.

Przykład: Jak używać Feed() do importowania plików do R

Załóżmy, że mam plik CSV o nazwie data.csv zapisany w następującej lokalizacji:

C:\Users\Bob\Desktop\data.csv

Załóżmy, że plik CSV zawiera następujące dane:

 team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

Mogę użyć funkcji fread() pakietu data.table , aby zaimportować ten plik do mojego bieżącego środowiska R:

 library (data.table)

#import data
df <- fread("C:\Users\Bob\Desktop\data.csv")

#viewdata
df

  team points assists
1 A 78 12
2 B 85 20
3 C 93 23
4 D 90 8
5 E 91 14

Udało nam się zaimportować plik CSV za pomocą funkcji fread() .

Uwaga : w ścieżce pliku użyliśmy podwójnych ukośników odwrotnych (\\), aby uniknąć typowych błędów importu .

Zauważ, że nie musieliśmy również określać separatora, ponieważ funkcja fread() automatycznie wykryła, że jest to przecinek.

Jeśli użyjemy funkcji str() do wyświetlenia struktury ramki danych, zobaczymy, że funkcja fread() również automatycznie zidentyfikowała typ obiektu dla każdej kolumny:

 #view structure of data
str(df)

Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Z wyniku możemy zobaczyć:

  • Zmienną zespołu jest znak.
  • Zmienna punktów jest liczbą całkowitą.
  • Zmienna pomocnicza jest liczbą całkowitą.

W tym przykładzie dla uproszczenia użyliśmy małej ramki danych (5 wierszy x 3 kolumny), ale w praktyce funkcja fread() jest w stanie szybko i sprawnie importować bloki danych zawierające dziesiątki tysięcy wierszy, co czyni ją preferowaną metodą importu dla dużych zbiorów danych.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak importować określone typy plików do R:

Jak importować pliki Excel do R
Jak zaimportować pliki TSV do R
Jak importować pliki Zip do R
Jak importować pliki SAS do R
Jak zaimportować pliki .dta do R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *