Як використовувати colclasses для швидкого імпорту даних у r


Ви можете використовувати аргумент colClasses під час імпорту файлу в R, щоб визначити класи для кожного стовпця:

 df <- read. csv (' my_data.csv ',
               colClasses=c(' character ', ' numeric ', ' numeric '))

Перевага використання colClasses полягає в тому, що ви можете імпортувати дані набагато швидше, особливо якщо файли надзвичайно великі.

У наступному прикладі показано, як використовувати цей аргумент на практиці.

Приклад: використання colClasses під час імпорту файлів

Припустімо, у мене є файл CSV під назвою my_data.csv із трьома стовпцями, які я хотів би імпортувати в R:

Для цього я можу використати такий синтаксис:

 #import CSV file
df <- read. csv (' my_data.csv ',
               colClasses=c(' character ', ' numeric ', ' numeric '))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points: num 91 99 104 103 105 88 89 93 96 99 ...
 $rebounds: num 33 23 26 25 25 26 29 30 34 23 ...

Зверніть увагу, що кількість значень в аргументі colClasses має збігатися з кількістю стовпців у фреймі даних.

Наприклад, якщо ви надаєте лише одне значення для аргументу colClasses , кожен стовпець у фреймі даних матиме той самий клас:

 #import CSV file
df <- read. csv (' my_data.csv ',
               colClasses=c(' character '))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points: chr "91" "99" "104" "103" ...
 $rebounds: chr "33" "23" "26" "25" ...

Зауважте, що кожен стовпець у отриманому фреймі даних має клас «символів», оскільки ми надали лише одне значення аргументу colClasses .

Зауважте, що ви можете вказати такі потенційні класи в аргументі colClasses :

  • персонаж : «привіт», «там», «світ»
  • комплекс : as.complex(-1), 4i
  • числові : as.integer(20), 3L
  • ціле число : 4, 12, 158
  • логіка : ІСТИНА, НЕПРАВДА

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції в R:

Як вручну ввести необроблені дані в R
Як імпортувати файли CSV у R
Як імпортувати файли Excel у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *