Jak importować pliki csv do r (krok po kroku)
Załóżmy, że mam plik CSV o nazwie data.csv zapisany w następującej lokalizacji:
C:\Users\Bob\Desktop\data.csv
Załóżmy, że plik CSV zawiera następujące dane:
team, points, assists 'A', 78, 12 'B', 85, 20 'C', 93, 23 'D', 90, 8 'E', 91, 14
Istnieją trzy popularne sposoby importowania tego pliku CSV do R:
1. Użyj read.csv z bazowego R (najwolniejsza metoda, ale działa dobrze w przypadku mniejszych zbiorów danych)
data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE )
2. Użyj read_csv z pakietu readr (2-3 razy szybciej niż read.csv)
library (readr) data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ")
3. Użyj fread z pakietu data.table (2-3 razy szybciej niż read_csv)
library (data.table) data3 <- fread(" C:\Users\Bob\Desktop\data.csv ")
W tym samouczku pokazano przykład użycia każdej z tych metod do importowania pliku CSV do języka R.
Metoda 1: Użycie read.csv
Jeśli Twój plik CSV jest stosunkowo mały, możesz po prostu użyć funkcji read.csv Base R, aby go zaimportować.
Korzystając z tej metody, pamiętaj o określeniu stringsAsFactors=FALSE , aby R nie konwertował zmiennych alfabetycznych lub kategorialnych na czynniki.
Poniższy kod pokazuje, jak użyć read.csv do zaimportowania tego pliku CSV do R:
#import data data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE ) #view structure of data str(data1) 'data.frame': 5 obs. of 3 variables: $ team: chr "'A'" "'B'" "'C'" "'D'" ... $points: int 78 85 93 90 91 $assists: int 12 20 23 8 14
Metoda 2: Użycie read_csv
Jeśli pracujesz z większymi plikami, możesz użyć funkcji read_csv pakietu readr:
library (readr) #import data data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ") #view structure of data str(data2) 'data.frame': 5 obs. of 3 variables: $ team: chr "'A'" "'B'" "'C'" "'D'" ... $points: int 78 85 93 90 91 $assists: int 12 20 23 8 14
Metoda 3: Użyj paszy
Jeśli Twój plik CSV jest bardzo duży, najszybszym sposobem zaimportowania go do R jest użycie funkcji fread w pakiecie data.table:
library (data.table) #import data data3 <- fread(" C:\Users\Bob\Desktop\data.csv ") #view structure of data str(data3) Classes 'data.table' and 'data.frame': 5 obs. of 3 variables: $ team: chr "'A'" "'B'" "'C'" "'D'" ... $points: int 78 85 93 90 91 $assists: int 12 20 23 8 14
Zauważ, że w każdym przykładzie użyliśmy podwójnych ukośników odwrotnych (\\) w ścieżce pliku, aby uniknąć następującego częstego błędu:
Error: '\U' used without hex digits in character string starting ""C:\U"
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak importować inne typy plików do R:
Jak importować pliki Excel do R
Jak zaimportować pliki TSV do R
Jak importować pliki Zip do R
Jak importować pliki SAS do R
Jak zaimportować pliki .dta do R