Csv-bestanden importeren in r (stap voor stap)
Laten we zeggen dat ik een CSV-bestand met de naam data.csv heb opgeslagen op de volgende locatie:
C:\Gebruikers\Bob\Desktop\data.csv
En stel dat het CSV-bestand de volgende gegevens bevat:
team, points, assists 'A', 78, 12 'B', 85, 20 'C', 93, 23 'D', 90, 8 'E', 91, 14
Er zijn drie veelgebruikte manieren om dit CSV-bestand in R te importeren:
1. Gebruik read.csv uit basis R (de langzaamste methode, maar werkt goed voor kleinere datasets)
data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE )
2. Gebruik read_csv uit het readr-pakket (2-3 keer sneller dan read.csv)
library (readr) data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ")
3. Gebruik fread uit het data.table-pakket (2-3 keer sneller dan read_csv)
library (data.table) data3 <- fread(" C:\Users\Bob\Desktop\data.csv ")
Deze tutorial toont een voorbeeld van het gebruik van elk van deze methoden om het CSV-bestand in R te importeren.
Methode 1: Read.csv gebruiken
Als uw CSV-bestand redelijk klein is, kunt u eenvoudig de read.csv- functie van Base R gebruiken om het te importeren.
Wanneer u deze methode gebruikt, zorg er dan voor dat u stringsAsFactors=FALSE opgeeft, zodat R alfabetische of categorische variabelen niet omzet in factoren.
De volgende code laat zien hoe u read.csv gebruikt om dit CSV-bestand in R te importeren:
#import data data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE ) #view structure of data str(data1) 'data.frame': 5 obs. of 3 variables: $ team: chr "'A'" "'B'" "'C'" "'D'" ... $points: int 78 85 93 90 91 $assists: int 12 20 23 8 14
Methode 2: read_csv gebruiken
Als u met grotere bestanden werkt, kunt u de read_csv- functie van het readr-pakket gebruiken:
library (readr) #import data data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ") #view structure of data str(data2) 'data.frame': 5 obs. of 3 variables: $ team: chr "'A'" "'B'" "'C'" "'D'" ... $points: int 78 85 93 90 91 $assists: int 12 20 23 8 14
Methode 3: Gebruik voer
Als uw CSV extreem groot is, kunt u deze het snelst in R importeren door de fread- functie in het data.table-pakket te gebruiken:
library (data.table) #import data data3 <- fread(" C:\Users\Bob\Desktop\data.csv ") #view structure of data str(data3) Classes 'data.table' and 'data.frame': 5 obs. of 3 variables: $ team: chr "'A'" "'B'" "'C'" "'D'" ... $points: int 78 85 93 90 91 $assists: int 12 20 23 8 14
Houd er rekening mee dat we in elk voorbeeld dubbele backslashes (\\) in het bestandspad hebben gebruikt om de volgende veelvoorkomende fout te voorkomen:
Error: '\U' used without hex digits in character string starting ""C:\U"
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere bestandstypen in R kunt importeren:
Excel-bestanden importeren in R
TSV-bestanden importeren in R
Zip-bestanden importeren in R
SAS-bestanden importeren in R
Hoe .dta-bestanden te importeren in R