Как использовать colclasses для быстрого импорта данных в r


Вы можете использовать аргумент colClasses при импорте файла в R, чтобы указать классы для каждого столбца:

 df <- read. csv (' my_data.csv ',
               colClasses=c(' character ', ' numeric ', ' numeric '))

Преимущество использования colClasses заключается в том, что вы можете импортировать данные гораздо быстрее, особенно если файлы очень большие.

В следующем примере показано, как использовать этот аргумент на практике.

Пример: использование colClasses при импорте файлов

Допустим, у меня есть файл CSV с именем my_data.csv с тремя столбцами, который я хотел бы импортировать в R:

Для этого я могу использовать следующий синтаксис:

 #import CSV file
df <- read. csv (' my_data.csv ',
               colClasses=c(' character ', ' numeric ', ' numeric '))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points: num 91 99 104 103 105 88 89 93 96 99 ...
 $rebounds: num 33 23 26 25 25 26 29 30 34 23 ...

Обратите внимание, что количество значений в аргументе colClasses должно соответствовать количеству столбцов во фрейме данных.

Например, если вы укажете только одно значение для аргумента colClasses , каждый столбец в фрейме данных будет иметь один и тот же класс:

 #import CSV file
df <- read. csv (' my_data.csv ',
               colClasses=c(' character '))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points: chr "91" "99" "104" "103" ...
 $rebounds: chr "33" "23" "26" "25" ...

Обратите внимание, что каждый столбец в результирующем фрейме данных имеет «символьный» класс, поскольку мы предоставили только одно значение аргументу colClasses .

Обратите внимание, что в аргументе colClasses вы можете указать следующие потенциальные классы:

  • персонаж : «эй», «там», «мир»
  • комплекс : as.complex(-1), 4i
  • числовой : as.integer(20), 3L
  • целое число : 4, 12, 158
  • логика : ИСТИНА, ЛОЖЬ

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в R:

Как вручную ввести необработанные данные в R
Как импортировать файлы CSV в R
Как импортировать файлы Excel в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *