Jak używać colclasses do szybkiego importowania danych do r
Możesz użyć argumentu colClasses podczas importowania pliku do R, aby określić klasy dla każdej kolumny:
df <- read. csv (' my_data.csv ', colClasses=c(' character ', ' numeric ', ' numeric '))
Zaletą korzystania z colClasses jest to, że możesz importować dane znacznie szybciej, szczególnie gdy pliki są bardzo duże.
Poniższy przykład pokazuje, jak zastosować ten argument w praktyce.
Przykład: użycie colClasses podczas importowania plików
Załóżmy, że mam plik CSV o nazwie my_data.csv zawierający trzy kolumny, które chciałbym zaimportować do R:
Aby to zrobić, mogę użyć następującej składni:
#import CSV file
df <- read. csv (' my_data.csv ',
colClasses=c(' character ', ' numeric ', ' numeric '))
#view class of each column in data frame
str(df)
'data.frame': 14 obs. of 3 variables:
$ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
$ points: num 91 99 104 103 105 88 89 93 96 99 ...
$rebounds: num 33 23 26 25 25 26 29 30 34 23 ...
Należy pamiętać, że liczba wartości w argumencie colClasses musi odpowiadać liczbie kolumn w ramce danych.
Na przykład, jeśli podasz tylko jedną wartość dla argumentu colClasses , każda kolumna w ramce danych będzie miała tę samą klasę:
#import CSV file
df <- read. csv (' my_data.csv ',
colClasses=c(' character '))
#view class of each column in data frame
str(df)
'data.frame': 14 obs. of 3 variables:
$ team: chr "Mavs" "Spurs" "Hornets" "Rockets" ...
$ points: chr "91" "99" "104" "103" ...
$rebounds: chr "33" "23" "26" "25" ...
Należy zauważyć, że każda kolumna w wynikowej ramce danych ma klasę „znakową”, ponieważ dostarczyliśmy tylko jedną wartość do argumentu colClasses .
Pamiętaj, że w argumencie colClasses możesz określić następujące potencjalne klasy:
- znak : „hej”, „tam”, „świat”
- złożony : as.kompleks(-1), 4i
- numeryczne : as.integer(20), 3L
- liczba całkowita : 4, 12, 158
- logika : PRAWDA, FAŁSZ
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje w języku R:
Jak ręcznie wprowadzić surowe dane w R
Jak importować pliki CSV do R
Jak importować pliki Excel do R