Как использовать fread() в r для более быстрого импорта файлов


Вы можете использовать функцию fread() пакета data.table в R для быстрого и легкого импорта файлов.

Эта функция использует следующий базовый синтаксис:

 library (data.table)

df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ")

Для больших файлов эта функция оказалась значительно быстрее, чем такие функции, как read.csv из базы R.

И в большинстве случаев эта функция также может автоматически определять разделители и типы столбцов для импортируемого набора данных.

В следующем примере показано, как использовать эту функцию на практике.

Пример: как использоватьfeed() для импорта файлов в R

Допустим, у меня есть файл CSV с именем data.csv , сохраненный в следующем месте:

C:\Users\Bob\Desktop\data.csv

Предположим, что файл CSV содержит следующие данные:

 team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

Я могу использовать функцию fread() пакета data.table , чтобы импортировать этот файл в мою текущую среду R:

 library (data.table)

#import data
df <- fread("C:\Users\Bob\Desktop\data.csv")

#viewdata
df

  team points assists
1 A 78 12
2 B 85 20
3 C 93 23
4 D 90 8
5 E 91 14

Мы можем успешно импортировать файл CSV с помощью функции fread() .

Примечание . Мы использовали двойную обратную косую черту (\\) в пути к файлу, чтобы избежать распространенной ошибки импорта .

Обратите внимание, что нам также не нужно было указывать разделитель, поскольку функция fread() автоматически определила, что это запятая.

Если мы используем функцию str() для отображения структуры фрейма данных, мы видим, что функция fread() также автоматически определила тип объекта для каждого столбца:

 #view structure of data
str(df)

Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

По результату мы видим:

  • Переменная команды — это персонаж.
  • Переменная Points является целым числом.
  • Вспомогательная переменная является целым числом.

В этом примере для простоты мы использовали небольшой фрейм данных (5 строк x 3 столбца), но на практике функция fread() способна быстро и эффективно импортировать блоки данных, содержащие десятки тысяч строк, что делает ее предпочтительным методом импорта. для крупномасштабных наборов данных.

Дополнительные ресурсы

В следующих руководствах объясняется, как импортировать файлы определенных типов в R:

Как импортировать файлы Excel в R
Как импортировать файлы TSV в R
Как импортировать ZIP-файлы в R
Как импортировать файлы SAS в R
Как импортировать файлы .dta в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *