Как использовать colclasses для быстрого импорта данных в r
Вы можете использовать аргумент colClasses при импорте файла в R, чтобы указать классы для каждого столбца:
df <- read. csv (' my_data.csv ', colClasses=c(' character ', ' numeric ', ' numeric '))
Преимущество использования colClasses заключается в том, что вы можете импортировать данные гораздо быстрее, особенно если файлы очень большие.
В следующем примере показано, как использовать этот аргумент на практике.
Пример: использование colClasses при импорте файлов
Допустим, у меня есть файл CSV с именем my_data.csv с тремя столбцами, который я хотел бы импортировать в R:
Для этого я могу использовать следующий синтаксис:
#import CSV file
df <- read. csv (' my_data.csv ',
colClasses=c(' character ', ' numeric ', ' numeric '))
#view class of each column in data frame
str(df)
'data.frame': 14 obs. of 3 variables:
$ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
$ points: num 91 99 104 103 105 88 89 93 96 99 ...
$rebounds: num 33 23 26 25 25 26 29 30 34 23 ...
Обратите внимание, что количество значений в аргументе colClasses должно соответствовать количеству столбцов во фрейме данных.
Например, если вы укажете только одно значение для аргумента colClasses , каждый столбец в фрейме данных будет иметь один и тот же класс:
#import CSV file
df <- read. csv (' my_data.csv ',
colClasses=c(' character '))
#view class of each column in data frame
str(df)
'data.frame': 14 obs. of 3 variables:
$ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
$ points: chr "91" "99" "104" "103" ...
$rebounds: chr "33" "23" "26" "25" ...
Обратите внимание, что каждый столбец в результирующем фрейме данных имеет «символьный» класс, поскольку мы предоставили только одно значение аргументу colClasses .
Обратите внимание, что в аргументе colClasses вы можете указать следующие потенциальные классы:
- персонаж : «эй», «там», «мир»
- комплекс : as.complex(-1), 4i
- числовой : as.integer(20), 3L
- целое число : 4, 12, 158
- логика : ИСТИНА, ЛОЖЬ
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции в R:
Как вручную ввести необработанные данные в R
Как импортировать файлы CSV в R
Как импортировать файлы Excel в R