Як використовувати fread() у r, щоб швидше імпортувати файли
Ви можете використовувати функцію fread() пакета data.table у R, щоб швидко та легко імпортувати файли.
Ця функція використовує такий базовий синтаксис:
library (data.table) df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ")
Для великих файлів ця функція виявилася значно швидшою, ніж такі функції, як read.csv з базового R.
У більшості випадків ця функція також може автоматично визначати роздільник і типи стовпців для набору даних, який ви імпортуєте.
У наступному прикладі показано, як використовувати цю функцію на практиці.
Приклад: як за допомогою feed() імпортувати файли в R
Припустімо, у мене є файл CSV під назвою data.csv , збережений у такому місці:
C:\Users\Bob\Desktop\data.csv
І припустимо, що файл CSV містить такі дані:
team, points, assists 'A', 78, 12 'B', 85, 20 'C', 93, 23 'D', 90, 8 'E', 91, 14
Я можу використати функцію fread() пакета data.table , щоб імпортувати цей файл у моє поточне середовище R:
library (data.table) #import data df <- fread("C:\Users\Bob\Desktop\data.csv") #viewdata df team points assists 1 A 78 12 2 B 85 20 3 C 93 23 4 D 90 8 5 E 91 14
Ми можемо успішно імпортувати файл CSV за допомогою функції fread() .
Примітка : ми використали подвійну зворотну косу риску (\\) у шляху до файлу, щоб уникнути типової помилки імпорту .
Зверніть увагу, що нам також не потрібно було вказувати роздільник, оскільки функція fread() автоматично визначила, що це кома.
Якщо ми використаємо функцію str() для відображення структури кадру даних, ми побачимо, що функція fread() також автоматично визначила тип об’єкта для кожного стовпця:
#view structure of data
str(df)
Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
$ team: chr "'A'" "'B'" "'C'" "'D'" ...
$points: int 78 85 93 90 91
$assists: int 12 20 23 8 14
З результату ми бачимо:
- Командна змінна – персонаж.
- Змінна Points є цілим числом.
- Допоміжна змінна є цілим числом.
У цьому прикладі для спрощення ми використали невеликий кадр даних (5 рядків x 3 стовпці), але на практиці функція fread() здатна швидко й ефективно імпортувати блоки даних, що містять десятки тисяч рядків, що робить її кращим методом імпорту для великомасштабних наборів даних.
Додаткові ресурси
У наступних посібниках пояснюється, як імпортувати певні типи файлів у R:
Як імпортувати файли Excel у R
Як імпортувати файли TSV у R
Як імпортувати файли Zip у R
Як імпортувати файли SAS у R
Як імпортувати файли .dta у R