Colclasses를 사용하여 r로 데이터를 빠르게 가져오는 방법


파일을 R로 가져올 때 colClasses 인수를 사용하여 각 열의 클래스를 지정할 수 있습니다.

 df <- read. csv (' my_data.csv ',
               colClasses=c(' character ', ' numeric ', ' numeric '))

colClasses를 사용하면 특히 파일이 매우 큰 경우 데이터를 훨씬 빠르게 가져올 수 있다는 이점이 있습니다.

다음 예에서는 이 인수를 실제로 사용하는 방법을 보여줍니다.

예: 파일을 가져올 때 colClasses 사용

R로 가져오려는 세 개의 열이 있는 my_data.csv 라는 CSV 파일이 있다고 가정해 보겠습니다.

이 작업을 수행하려면 다음 구문을 사용할 수 있습니다.

 #import CSV file
df <- read. csv (' my_data.csv ',
               colClasses=c(' character ', ' numeric ', ' numeric '))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points: num 91 99 104 103 105 88 89 93 96 99 ...
 $rebounds: num 33 23 26 25 25 26 29 30 34 23 ...

colClasses 인수의 값 개수는 데이터 프레임의 열 개수와 일치해야 합니다.

예를 들어 colClasses 인수에 하나의 값만 제공하는 경우 데이터 프레임의 각 열은 동일한 클래스를 갖습니다.

 #import CSV file
df <- read. csv (' my_data.csv ',
               colClasses=c(' character '))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points: chr "91" "99" "104" "103" ...
 $rebounds: chr "33" "23" "26" "25" ...

colClasses 인수에 단일 값만 제공했기 때문에 결과 데이터 프레임의 각 열에는 “문자” 클래스가 있습니다.

colClasses 인수에 다음과 같은 잠재적 클래스를 지정할 수 있습니다.

  • 문자 : “안녕”, “저기”, “세상”
  • 복잡한 : as.complex(-1), 4i
  • 숫자 : as.integer(20), 3L
  • 정수 : 4, 12, 158
  • 논리 : TRUE, FALSE

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

R에서 원시 데이터를 수동으로 입력하는 방법
CSV 파일을 R로 가져오는 방법
Excel 파일을 R로 가져오는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다