Csv-bestanden importeren in r (stap voor stap)


Laten we zeggen dat ik een CSV-bestand met de naam data.csv heb opgeslagen op de volgende locatie:

C:\Gebruikers\Bob\Desktop\data.csv

En stel dat het CSV-bestand de volgende gegevens bevat:

 team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

Er zijn drie veelgebruikte manieren om dit CSV-bestand in R te importeren:

1. Gebruik read.csv uit basis R (de langzaamste methode, maar werkt goed voor kleinere datasets)

 data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE )

2. Gebruik read_csv uit het readr-pakket (2-3 keer sneller dan read.csv)

 library (readr)

data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ")

3. Gebruik fread uit het data.table-pakket (2-3 keer sneller dan read_csv)

 library (data.table)

data3 <- fread(" C:\Users\Bob\Desktop\data.csv ")

Deze tutorial toont een voorbeeld van het gebruik van elk van deze methoden om het CSV-bestand in R te importeren.

Methode 1: Read.csv gebruiken

Als uw CSV-bestand redelijk klein is, kunt u eenvoudig de read.csv- functie van Base R gebruiken om het te importeren.

Wanneer u deze methode gebruikt, zorg er dan voor dat u stringsAsFactors=FALSE opgeeft, zodat R alfabetische of categorische variabelen niet omzet in factoren.

De volgende code laat zien hoe u read.csv gebruikt om dit CSV-bestand in R te importeren:

 #import data
data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE )

#view structure of data
str(data1)

'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Methode 2: read_csv gebruiken

Als u met grotere bestanden werkt, kunt u de read_csv- functie van het readr-pakket gebruiken:

 library (readr)

#import data
data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ")

#view structure of data
str(data2)

'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Methode 3: Gebruik voer

Als uw CSV extreem groot is, kunt u deze het snelst in R importeren door de fread- functie in het data.table-pakket te gebruiken:

 library (data.table)

#import data
data3 <- fread(" C:\Users\Bob\Desktop\data.csv ")

#view structure of data
str(data3)

Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Houd er rekening mee dat we in elk voorbeeld dubbele backslashes (\\) in het bestandspad hebben gebruikt om de volgende veelvoorkomende fout te voorkomen:

 Error: '\U' used without hex digits in character string starting ""C:\U"

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere bestandstypen in R kunt importeren:

Excel-bestanden importeren in R
TSV-bestanden importeren in R
Zip-bestanden importeren in R
SAS-bestanden importeren in R
Hoe .dta-bestanden te importeren in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert