Jak importować pliki csv do r (krok po kroku)


Załóżmy, że mam plik CSV o nazwie data.csv zapisany w następującej lokalizacji:

C:\Users\Bob\Desktop\data.csv

Załóżmy, że plik CSV zawiera następujące dane:

 team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

Istnieją trzy popularne sposoby importowania tego pliku CSV do R:

1. Użyj read.csv z bazowego R (najwolniejsza metoda, ale działa dobrze w przypadku mniejszych zbiorów danych)

 data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE )

2. Użyj read_csv z pakietu readr (2-3 razy szybciej niż read.csv)

 library (readr)

data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ")

3. Użyj fread z pakietu data.table (2-3 razy szybciej niż read_csv)

 library (data.table)

data3 <- fread(" C:\Users\Bob\Desktop\data.csv ")

W tym samouczku pokazano przykład użycia każdej z tych metod do importowania pliku CSV do języka R.

Metoda 1: Użycie read.csv

Jeśli Twój plik CSV jest stosunkowo mały, możesz po prostu użyć funkcji read.csv Base R, aby go zaimportować.

Korzystając z tej metody, pamiętaj o określeniu stringsAsFactors=FALSE , aby R nie konwertował zmiennych alfabetycznych lub kategorialnych na czynniki.

Poniższy kod pokazuje, jak użyć read.csv do zaimportowania tego pliku CSV do R:

 #import data
data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE )

#view structure of data
str(data1)

'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Metoda 2: Użycie read_csv

Jeśli pracujesz z większymi plikami, możesz użyć funkcji read_csv pakietu readr:

 library (readr)

#import data
data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ")

#view structure of data
str(data2)

'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Metoda 3: Użyj paszy

Jeśli Twój plik CSV jest bardzo duży, najszybszym sposobem zaimportowania go do R jest użycie funkcji fread w pakiecie data.table:

 library (data.table)

#import data
data3 <- fread(" C:\Users\Bob\Desktop\data.csv ")

#view structure of data
str(data3)

Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Zauważ, że w każdym przykładzie użyliśmy podwójnych ukośników odwrotnych (\\) w ścieżce pliku, aby uniknąć następującego częstego błędu:

 Error: '\U' used without hex digits in character string starting ""C:\U"

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak importować inne typy plików do R:

Jak importować pliki Excel do R
Jak zaimportować pliki TSV do R
Jak importować pliki Zip do R
Jak importować pliki SAS do R
Jak zaimportować pliki .dta do R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *