R에서 fread()를 사용하여 파일을 더 빠르게 가져오는 방법


R에서 data.table 패키지의 fread() 함수를 사용하여 파일을 빠르고 쉽게 가져올 수 있습니다.

이 함수는 다음 기본 구문을 사용합니다.

 library (data.table)

df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ")

대용량 파일의 경우 이 기능은 기본 R의 read.csv 와 같은 기능보다 훨씬 빠른 것으로 나타났습니다.

그리고 대부분의 경우 이 기능은 가져오는 데이터 세트의 구분 기호와 열 유형을 자동으로 감지할 수도 있습니다.

다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.

예: R로 파일을 가져오기 위해 Feed()를 사용하는 방법

다음 위치에 data.csv 라는 CSV 파일이 저장되어 있다고 가정해 보겠습니다.

C:\Users\Bob\Desktop\data.csv

그리고 CSV 파일에 다음 데이터가 포함되어 있다고 가정합니다.

 team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

data.table 패키지의 fread() 함수를 사용하여 이 파일을 현재 R 환경으로 가져올 수 있습니다.

 library (data.table)

#import data
df <- fread("C:\Users\Bob\Desktop\data.csv")

#viewdata
df

  team points assists
1 A 78 12
2 B 85 20
3 C 93 23
4 D 90 8
5 E 91 14

fread() 함수를 사용하여 CSV 파일을 성공적으로 가져올 수 있습니다.

참고 : 일반적인 가져오기 오류를 방지하기 위해 파일 경로에 이중 백슬래시(\\)를 사용했습니다.

fread() 함수가 자동으로 쉼표임을 감지했기 때문에 구분 기호를 지정할 필요도 없었습니다.

str() 함수를 사용하여 데이터 프레임의 구조를 표시하면 fread() 함수가 각 열의 객체 유형도 자동으로 식별했음을 알 수 있습니다.

 #view structure of data
str(df)

Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

결과에서 우리는 다음을 볼 수 있습니다:

  • 변수는 문자입니다.
  • points 변수는 정수입니다.
  • 도우미 변수는 정수입니다.

이 예에서는 단순화를 위해 작은 데이터 프레임(5행 x 3열)을 사용했지만 실제로 fread() 함수는 수만 행이 포함된 데이터 블록을 빠르고 효율적으로 가져올 수 있으므로 선호되는 가져오기 방법입니다. 대규모 데이터 세트의 경우.

추가 리소스

다음 튜토리얼에서는 특정 파일 형식을 R로 가져오는 방법을 설명합니다.

Excel 파일을 R로 가져오는 방법
TSV 파일을 R로 가져오는 방법
Zip 파일을 R로 가져오는 방법
SAS 파일을 R로 가져오는 방법
.dta 파일을 R로 가져오는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다