So verwenden sie colclasses, um daten schnell in r zu importieren


Sie können das Argument colClasses beim Importieren einer Datei in R verwenden, um die Klassen für jede Spalte anzugeben:

 df <- read. csv (' my_data.csv ',
               colClasses=c(' character ', ' numeric ', ' numeric '))

Der Vorteil der Verwendung von colClasses besteht darin, dass Sie Daten viel schneller importieren können, insbesondere wenn die Dateien extrem groß sind.

Das folgende Beispiel zeigt, wie dieses Argument in der Praxis verwendet wird.

Beispiel: Verwendung von colClasses beim Importieren von Dateien

Nehmen wir an, ich habe eine CSV-Datei namens my_data.csv mit drei Spalten, die ich in R importieren möchte:

Ich kann dazu die folgende Syntax verwenden:

 #import CSV file
df <- read. csv (' my_data.csv ',
               colClasses=c(' character ', ' numeric ', ' numeric '))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points: num 91 99 104 103 105 88 89 93 96 99 ...
 $rebounds: num 33 23 26 25 25 26 29 30 34 23 ...

Beachten Sie, dass die Anzahl der Werte im Argument colClasses mit der Anzahl der Spalten im Datenrahmen übereinstimmen muss.

Wenn Sie beispielsweise nur einen Wert für das Argument colClasses angeben, hat jede Spalte im Datenrahmen dieselbe Klasse:

 #import CSV file
df <- read. csv (' my_data.csv ',
               colClasses=c(' character '))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points: chr "91" "99" "104" "103" ...
 $rebounds: chr "33" "23" "26" "25" ...

Beachten Sie, dass jede Spalte im resultierenden Datenrahmen eine „Zeichen“-Klasse hat, da wir nur einen einzigen Wert für das Argument colClasses angegeben haben.

Beachten Sie, dass Sie im Argument colClasses die folgenden potenziellen Klassen angeben können:

  • Charakter : „hey“, „there“, „world“
  • komplex : as.complex(-1), 4i
  • Numerisch : as.integer(20), 3L
  • Ganzzahl : 4, 12, 158
  • Logik : WAHR, FALSCH

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in R ausgeführt werden:

So geben Sie Rohdaten manuell in R ein
So importieren Sie CSV-Dateien in R
So importieren Sie Excel-Dateien in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert