Как импортировать файлы csv в r (шаг за шагом)
Допустим, у меня есть файл CSV с именем data.csv , сохраненный в следующем месте:
C:\Users\Bob\Desktop\data.csv
Предположим, что файл CSV содержит следующие данные:
team, points, assists 'A', 78, 12 'B', 85, 20 'C', 93, 23 'D', 90, 8 'E', 91, 14
Существует три распространенных способа импортировать этот CSV-файл в R:
1. Используйте read.csv из базы R (самый медленный метод, но хорошо работает для небольших наборов данных).
data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE )
2. Используйте read_csv из пакета readr (в 2-3 раза быстрее, чем read.csv)
library (readr) data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ")
3. Используйте fread из пакета data.table (в 2-3 раза быстрее, чем read_csv)
library (data.table) data3 <- fread(" C:\Users\Bob\Desktop\data.csv ")
В этом руководстве показан пример использования каждого из этих методов для импорта файла CSV в R.
Способ 1: использование read.csv
Если ваш файл CSV достаточно мал, вы можете просто использовать функцию read.csv Base R для его импорта.
При использовании этого метода обязательно укажите stringsAsFactors=FALSE , чтобы R не преобразовывал буквенные или категориальные переменные в факторы.
Следующий код показывает, как использовать read.csv для импорта этого CSV-файла в R:
#import data data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE ) #view structure of data str(data1) 'data.frame': 5 obs. of 3 variables: $ team: chr "'A'" "'B'" "'C'" "'D'" ... $points: int 78 85 93 90 91 $assists: int 12 20 23 8 14
Способ 2: использование read_csv
Если вы работаете с файлами большего размера, вы можете использовать функцию read_csv пакета readr:
library (readr) #import data data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ") #view structure of data str(data2) 'data.frame': 5 obs. of 3 variables: $ team: chr "'A'" "'B'" "'C'" "'D'" ... $points: int 78 85 93 90 91 $assists: int 12 20 23 8 14
Способ 3. Используйте корм.
Если ваш CSV-файл очень большой, самый быстрый способ импортировать его в R — использовать функцию fread в пакете data.table:
library (data.table) #import data data3 <- fread(" C:\Users\Bob\Desktop\data.csv ") #view structure of data str(data3) Classes 'data.table' and 'data.frame': 5 obs. of 3 variables: $ team: chr "'A'" "'B'" "'C'" "'D'" ... $points: int 78 85 93 90 91 $assists: int 12 20 23 8 14
Обратите внимание, что в каждом примере мы использовали двойную обратную косую черту (\\) в пути к файлу, чтобы избежать следующей распространенной ошибки:
Error: '\U' used without hex digits in character string starting ""C:\U"
Дополнительные ресурсы
В следующих руководствах объясняется, как импортировать файлы других типов в R:
Как импортировать файлы Excel в R
Как импортировать файлы TSV в R
Как импортировать ZIP-файлы в R
Как импортировать файлы SAS в R
Как импортировать файлы .dta в R