So verwenden sie fread() in r, um dateien schneller zu importieren


Sie können die Funktion fread() des data.table- Pakets in R verwenden, um Dateien schnell und einfach zu importieren.

Diese Funktion verwendet die folgende grundlegende Syntax:

 library (data.table)

df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ")

Bei großen Dateien erwies sich diese Funktion als deutlich schneller als Funktionen wie read.csv von Base R.

Und in den meisten Fällen kann diese Funktion auch automatisch die Trennzeichen und Spaltentypen für den Datensatz erkennen, den Sie importieren.

Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis nutzen können.

Beispiel: So verwenden Sie „feed()“ zum Importieren von Dateien in R

Nehmen wir an, ich habe eine CSV-Datei mit dem Namen data.csv am folgenden Speicherort gespeichert:

C:\Benutzer\Bob\Desktop\data.csv

Und gehen Sie davon aus, dass die CSV-Datei die folgenden Daten enthält:

 team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

Ich kann die fread()- Funktion des data.table- Pakets verwenden, um diese Datei in meine aktuelle R-Umgebung zu importieren:

 library (data.table)

#import data
df <- fread("C:\Users\Bob\Desktop\data.csv")

#viewdata
df

  team points assists
1 A 78 12
2 B 85 20
3 C 93 23
4 D 90 8
5 E 91 14

Mit der Funktion fread() können wir die CSV-Datei erfolgreich importieren.

Hinweis : Wir haben im Dateipfad doppelte Backslashes (\\) verwendet, um einen häufigen Importfehler zu vermeiden.

Beachten Sie, dass wir das Trennzeichen auch nicht angeben mussten, da die Funktion fread() automatisch erkannte, dass es sich um ein Komma handelte.

Wenn wir die Funktion str() verwenden, um die Struktur des Datenrahmens anzuzeigen, können wir sehen, dass die Funktion fread() auch automatisch den Objekttyp für jede Spalte identifiziert hat:

 #view structure of data
str(df)

Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Aus dem Ergebnis können wir sehen:

  • Die Teamvariable ist ein Charakter.
  • Die Punktevariable ist eine Ganzzahl.
  • Die Hilfsvariable ist eine Ganzzahl.

In diesem Beispiel haben wir der Einfachheit halber einen kleinen Datenrahmen verwendet (5 Zeilen x 3 Spalten), aber in der Praxis ist die Funktion fread() in der Lage, Datenblöcke mit Zehntausenden von Zeilen schnell und effizient zu importieren, was sie zur bevorzugten Importmethode macht für große Datensätze.

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie bestimmte Dateitypen in R importieren:

So importieren Sie Excel-Dateien in R
So importieren Sie TSV-Dateien in R
So importieren Sie Zip-Dateien in R
So importieren Sie SAS-Dateien in R
So importieren Sie .dta-Dateien in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert