So importieren sie csv-dateien in r (schritt für schritt)
Nehmen wir an, ich habe eine CSV-Datei mit dem Namen data.csv am folgenden Speicherort gespeichert:
C:\Benutzer\Bob\Desktop\data.csv
Und gehen Sie davon aus, dass die CSV-Datei die folgenden Daten enthält:
team, points, assists 'A', 78, 12 'B', 85, 20 'C', 93, 23 'D', 90, 8 'E', 91, 14
Es gibt drei gängige Möglichkeiten, diese CSV-Datei in R zu importieren:
1. Verwenden Sie read.csv von Base R (langsamste Methode, funktioniert aber gut für kleinere Datensätze)
data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE )
2. Verwenden Sie read_csv aus dem readr-Paket (2-3-mal schneller als read.csv).
library (readr) data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ")
3. Verwenden Sie fread aus dem data.table-Paket (2-3-mal schneller als read_csv).
library (data.table) data3 <- fread(" C:\Users\Bob\Desktop\data.csv ")
Dieses Tutorial zeigt ein Beispiel für die Verwendung jeder dieser Methoden zum Importieren der CSV-Datei in R.
Methode 1: Verwenden von read.csv
Wenn Ihre CSV-Datei relativ klein ist, können Sie sie einfach mit der Funktion read.csv von Base R importieren.
Wenn Sie diese Methode verwenden, müssen Sie unbedingt stringsAsFactors=FALSE angeben, damit R alphabetische oder kategoriale Variablen nicht in Faktoren umwandelt.
Der folgende Code zeigt, wie Sie read.csv verwenden, um diese CSV-Datei in R zu importieren:
#import data data1 <- read.csv(" C:\\Users\\Bob\\Desktop\\data.csv ", header= TRUE , stringsAsFactors= FALSE ) #view structure of data str(data1) 'data.frame': 5 obs. of 3 variables: $ team: chr "'A'" "'B'" "'C'" "'D'" ... $points: int 78 85 93 90 91 $assists: int 12 20 23 8 14
Methode 2: Verwendung von read_csv
Wenn Sie mit größeren Dateien arbeiten, können Sie die Funktion read_csv des Pakets readr verwenden:
library (readr) #import data data2 <- read_csv(" C:\Users\Bob\Desktop\data.csv ") #view structure of data str(data2) 'data.frame': 5 obs. of 3 variables: $ team: chr "'A'" "'B'" "'C'" "'D'" ... $points: int 78 85 93 90 91 $assists: int 12 20 23 8 14
Methode 3: Futter verwenden
Wenn Ihre CSV-Datei extrem groß ist, können Sie sie am schnellsten in R importieren, indem Sie die fread- Funktion im data.table-Paket verwenden:
library (data.table) #import data data3 <- fread(" C:\Users\Bob\Desktop\data.csv ") #view structure of data str(data3) Classes 'data.table' and 'data.frame': 5 obs. of 3 variables: $ team: chr "'A'" "'B'" "'C'" "'D'" ... $points: int 78 85 93 90 91 $assists: int 12 20 23 8 14
Beachten Sie, dass wir in jedem Beispiel doppelte Backslashes (\\) im Dateipfad verwendet haben, um den folgenden häufigen Fehler zu vermeiden:
Error: '\U' used without hex digits in character string starting ""C:\U"
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie man andere Dateitypen in R importiert:
So importieren Sie Excel-Dateien in R
So importieren Sie TSV-Dateien in R
So importieren Sie Zip-Dateien in R
So importieren Sie SAS-Dateien in R
So importieren Sie .dta-Dateien in R