Colclasses gebruiken om snel gegevens in r te importeren


U kunt het argument colClasses gebruiken bij het importeren van een bestand in R om de klassen voor elke kolom op te geven:

 df <- read. csv (' my_data.csv ',
               colClasses=c(' character ', ' numeric ', ' numeric '))

Het voordeel van het gebruik van colClasses is dat u gegevens veel sneller kunt importeren, vooral als de bestanden extreem groot zijn.

Het volgende voorbeeld laat zien hoe u dit argument in de praktijk kunt gebruiken.

Voorbeeld: colClasses gebruiken bij het importeren van bestanden

Laten we zeggen dat ik een CSV-bestand heb met de naam my_data.csv met drie kolommen die ik in R wil importeren:

Ik kan hiervoor de volgende syntaxis gebruiken:

 #import CSV file
df <- read. csv (' my_data.csv ',
               colClasses=c(' character ', ' numeric ', ' numeric '))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points: num 91 99 104 103 105 88 89 93 96 99 ...
 $rebounds: num 33 23 26 25 25 26 29 30 34 23 ...

Houd er rekening mee dat het aantal waarden in het colClasses- argument moet overeenkomen met het aantal kolommen in het dataframe.

Als u bijvoorbeeld slechts één waarde opgeeft voor het argument colClasses , heeft elke kolom in het gegevensframe dezelfde klasse:

 #import CSV file
df <- read. csv (' my_data.csv ',
               colClasses=c(' character '))

#view class of each column in data frame
str(df)

'data.frame': 14 obs. of 3 variables:
 $ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points: chr "91" "99" "104" "103" ...
 $rebounds: chr "33" "23" "26" "25" ...

Houd er rekening mee dat elke kolom in het resulterende gegevensframe een klasse „character“ heeft, aangezien we slechts één waarde aan het argument colClasses hebben opgegeven.

Houd er rekening mee dat u de volgende potentiële klassen kunt opgeven in het colClasses- argument:

  • karakter : “hey”, “daar”, “wereld”
  • complex : as.complex(-1), 4i
  • numeriek : as.integer(20), 3L
  • geheel getal : 4, 12, 158
  • logica : WAAR, ONWAAR

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in R kunt uitvoeren:

Handmatig ruwe gegevens invoeren in R
CSV-bestanden importeren in R
Excel-bestanden importeren in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert