Como usar fread() em r para importar arquivos mais rapidamente
Você pode usar a função fread() do pacote data.table em R para importar arquivos de forma rápida e fácil.
Esta função usa a seguinte sintaxe básica:
library (data.table) df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ")
Para arquivos grandes, esta função foi significativamente mais rápida do que funções como read.csv da base R.
E na maioria dos casos, esta função também pode detectar automaticamente o delimitador e os tipos de coluna do conjunto de dados que você está importando.
O exemplo a seguir mostra como usar esta função na prática.
Exemplo: como usar feed() para importar arquivos para R
Digamos que eu tenha um arquivo CSV chamado data.csv salvo no seguinte local:
C:\Usuários\Bob\Desktop\data.csv
E suponha que o arquivo CSV contenha os seguintes dados:
team, points, assists 'A', 78, 12 'B', 85, 20 'C', 93, 23 'D', 90, 8 'E', 91, 14
Posso usar a função fread() do pacote data.table para importar este arquivo para meu ambiente R atual:
library (data.table) #import data df <- fread("C:\Users\Bob\Desktop\data.csv") #viewdata df team points assists 1 A 78 12 2 B 85 20 3 C 93 23 4 D 90 8 5 E 91 14
Conseguimos importar com sucesso o arquivo CSV usando a função fread() .
Observação : usamos barras invertidas duplas (\\) no caminho do arquivo para evitar um erro comum de importação .
Observe que também não precisamos especificar o delimitador, pois a função fread() detectou automaticamente que era uma vírgula.
Se usarmos a função str() para exibir a estrutura do quadro de dados, podemos ver que a função fread() também identificou automaticamente o tipo de objeto para cada coluna:
#view structure of data
str(df)
Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
$ team: chr "'A'" "'B'" "'C'" "'D'" ...
$points: int 78 85 93 90 91
$assists: int 12 20 23 8 14
Pelo resultado podemos ver:
- A variável da equipe é um personagem.
- A variável de pontos é um número inteiro.
- A variável auxiliar é um número inteiro.
Neste exemplo, usamos um pequeno quadro de dados para simplificar (5 linhas x 3 colunas), mas na prática a função fread() é capaz de importar de forma rápida e eficiente blocos de dados contendo dezenas de milhares de linhas, tornando-o o método de importação preferido para conjuntos de dados em grande escala.
Recursos adicionais
Os tutoriais a seguir explicam como importar tipos de arquivos específicos para R:
Como importar arquivos Excel para R
Como importar arquivos TSV para R
Como importar arquivos Zip para R
Como importar arquivos SAS para R
Como importar arquivos .dta para R