So importieren sie csv-dateien in r (schritt für schritt)


Nehmen wir an, ich habe eine CSV-Datei mit dem Namen data.csv am folgenden Speicherort gespeichert:

C:\Benutzer\Bob\Desktop\data.csv

Und gehen Sie davon aus, dass die CSV-Datei die folgenden Daten enthält:

 team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

Es gibt drei gängige Möglichkeiten, diese CSV-Datei in R zu importieren:

1. Verwenden Sie read.csv von Base R (langsamste Methode, funktioniert aber gut für kleinere Datensätze)

 data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE )

2. Verwenden Sie read_csv aus dem readr-Paket (2-3-mal schneller als read.csv).

 library (readr)

data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ")

3. Verwenden Sie fread aus dem data.table-Paket (2-3-mal schneller als read_csv).

 library (data.table)

data3 <- fread(" C:\Users\Bob\Desktop\data.csv ")

Dieses Tutorial zeigt ein Beispiel für die Verwendung jeder dieser Methoden zum Importieren der CSV-Datei in R.

Methode 1: Verwenden von read.csv

Wenn Ihre CSV-Datei relativ klein ist, können Sie sie einfach mit der Funktion read.csv von Base R importieren.

Wenn Sie diese Methode verwenden, müssen Sie unbedingt stringsAsFactors=FALSE angeben, damit R alphabetische oder kategoriale Variablen nicht in Faktoren umwandelt.

Der folgende Code zeigt, wie Sie read.csv verwenden, um diese CSV-Datei in R zu importieren:

 #import data
data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE )

#view structure of data
str(data1)

'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Methode 2: Verwendung von read_csv

Wenn Sie mit größeren Dateien arbeiten, können Sie die Funktion read_csv des Pakets readr verwenden:

 library (readr)

#import data
data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ")

#view structure of data
str(data2)

'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Methode 3: Futter verwenden

Wenn Ihre CSV-Datei extrem groß ist, können Sie sie am schnellsten in R importieren, indem Sie die fread- Funktion im data.table-Paket verwenden:

 library (data.table)

#import data
data3 <- fread(" C:\Users\Bob\Desktop\data.csv ")

#view structure of data
str(data3)

Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Beachten Sie, dass wir in jedem Beispiel doppelte Backslashes (\\) im Dateipfad verwendet haben, um den folgenden häufigen Fehler zu vermeiden:

 Error: '\U' used without hex digits in character string starting ""C:\U"

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie man andere Dateitypen in R importiert:

So importieren Sie Excel-Dateien in R
So importieren Sie TSV-Dateien in R
So importieren Sie Zip-Dateien in R
So importieren Sie SAS-Dateien in R
So importieren Sie .dta-Dateien in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert