Як імпортувати файли csv у r (крок за кроком)


Припустімо, у мене є файл CSV під назвою data.csv , збережений у такому місці:

C:\Users\Bob\Desktop\data.csv

І припустимо, що файл CSV містить такі дані:

 team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

Існує три поширені способи імпорту цього файлу CSV у R:

1. Використовуйте read.csv з бази R (найповільніший метод, але добре працює для менших наборів даних)

 data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE )

2. Використовуйте read_csv з пакету readr (у 2-3 рази швидше, ніж read.csv)

 library (readr)

data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ")

3. Використовуйте fread з пакета data.table (у 2-3 рази швидше, ніж read_csv)

 library (data.table)

data3 <- fread(" C:\Users\Bob\Desktop\data.csv ")

У цьому підручнику показано приклад використання кожного з цих методів для імпортування файлу CSV у R.

Спосіб 1. Використання read.csv

Якщо ваш файл CSV достатньо малий, ви можете просто використати функцію read.csv Base R, щоб імпортувати його.

Використовуючи цей метод, обов’язково вкажіть stringsAsFactors=FALSE , щоб R не перетворювало алфавітні чи категоріальні змінні на множники.

Наступний код показує, як використовувати read.csv для імпорту цього файлу CSV у R:

 #import data
data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE )

#view structure of data
str(data1)

'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Спосіб 2: Використання read_csv

Якщо ви працюєте з більшими файлами, ви можете скористатися функцією read_csv пакета readr:

 library (readr)

#import data
data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ")

#view structure of data
str(data2)

'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Спосіб 3: Використовуйте корм

Якщо ваш файл CSV надзвичайно великий, найшвидший спосіб імпортувати його в R — скористатися функцією fread у пакеті data.table:

 library (data.table)

#import data
data3 <- fread(" C:\Users\Bob\Desktop\data.csv ")

#view structure of data
str(data3)

Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Зауважте, що в кожному прикладі ми використовували подвійні зворотні косі риски (\\) у шляху до файлу, щоб уникнути такої типової помилки:

 Error: '\U' used without hex digits in character string starting ""C:\U"

Додаткові ресурси

У наступних посібниках пояснюється, як імпортувати інші типи файлів у R:

Як імпортувати файли Excel у R
Як імпортувати файли TSV у R
Як імпортувати файли Zip у R
Як імпортувати файли SAS у R
Як імпортувати файли .dta у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *