Як використовувати colclasses для швидкого імпорту даних у r
Ви можете використовувати аргумент colClasses під час імпорту файлу в R, щоб визначити класи для кожного стовпця:
df <- read. csv (' my_data.csv ', colClasses=c(' character ', ' numeric ', ' numeric '))
Перевага використання colClasses полягає в тому, що ви можете імпортувати дані набагато швидше, особливо якщо файли надзвичайно великі.
У наступному прикладі показано, як використовувати цей аргумент на практиці.
Приклад: використання colClasses під час імпорту файлів
Припустімо, у мене є файл CSV під назвою my_data.csv із трьома стовпцями, які я хотів би імпортувати в R:
Для цього я можу використати такий синтаксис:
#import CSV file
df <- read. csv (' my_data.csv ',
colClasses=c(' character ', ' numeric ', ' numeric '))
#view class of each column in data frame
str(df)
'data.frame': 14 obs. of 3 variables:
$ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
$ points: num 91 99 104 103 105 88 89 93 96 99 ...
$rebounds: num 33 23 26 25 25 26 29 30 34 23 ...
Зверніть увагу, що кількість значень в аргументі colClasses має збігатися з кількістю стовпців у фреймі даних.
Наприклад, якщо ви надаєте лише одне значення для аргументу colClasses , кожен стовпець у фреймі даних матиме той самий клас:
#import CSV file
df <- read. csv (' my_data.csv ',
colClasses=c(' character '))
#view class of each column in data frame
str(df)
'data.frame': 14 obs. of 3 variables:
$ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
$ points: chr "91" "99" "104" "103" ...
$rebounds: chr "33" "23" "26" "25" ...
Зауважте, що кожен стовпець у отриманому фреймі даних має клас «символів», оскільки ми надали лише одне значення аргументу colClasses .
Зауважте, що ви можете вказати такі потенційні класи в аргументі colClasses :
- персонаж : «привіт», «там», «світ»
- комплекс : as.complex(-1), 4i
- числові : as.integer(20), 3L
- ціле число : 4, 12, 158
- логіка : ІСТИНА, НЕПРАВДА
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові операції в R:
Як вручну ввести необроблені дані в R
Як імпортувати файли CSV у R
Як імпортувати файли Excel у R