Como usar fread() em r para importar arquivos mais rapidamente


Você pode usar a função fread() do pacote data.table em R para importar arquivos de forma rápida e fácil.

Esta função usa a seguinte sintaxe básica:

 library (data.table)

df <- fread(" C:\\Users\\Path\\To\\My\\data.csv ")

Para arquivos grandes, esta função foi significativamente mais rápida do que funções como read.csv da base R.

E na maioria dos casos, esta função também pode detectar automaticamente o delimitador e os tipos de coluna do conjunto de dados que você está importando.

O exemplo a seguir mostra como usar esta função na prática.

Exemplo: como usar feed() para importar arquivos para R

Digamos que eu tenha um arquivo CSV chamado data.csv salvo no seguinte local:

C:\Usuários\Bob\Desktop\data.csv

E suponha que o arquivo CSV contenha os seguintes dados:

 team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

Posso usar a função fread() do pacote data.table para importar este arquivo para meu ambiente R atual:

 library (data.table)

#import data
df <- fread("C:\Users\Bob\Desktop\data.csv")

#viewdata
df

  team points assists
1 A 78 12
2 B 85 20
3 C 93 23
4 D 90 8
5 E 91 14

Conseguimos importar com sucesso o arquivo CSV usando a função fread() .

Observação : usamos barras invertidas duplas (\\) no caminho do arquivo para evitar um erro comum de importação .

Observe que também não precisamos especificar o delimitador, pois a função fread() detectou automaticamente que era uma vírgula.

Se usarmos a função str() para exibir a estrutura do quadro de dados, podemos ver que a função fread() também identificou automaticamente o tipo de objeto para cada coluna:

 #view structure of data
str(df)

Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $points: int 78 85 93 90 91
 $assists: int 12 20 23 8 14

Pelo resultado podemos ver:

  • A variável da equipe é um personagem.
  • A variável de pontos é um número inteiro.
  • A variável auxiliar é um número inteiro.

Neste exemplo, usamos um pequeno quadro de dados para simplificar (5 linhas x 3 colunas), mas na prática a função fread() é capaz de importar de forma rápida e eficiente blocos de dados contendo dezenas de milhares de linhas, tornando-o o método de importação preferido para conjuntos de dados em grande escala.

Recursos adicionais

Os tutoriais a seguir explicam como importar tipos de arquivos específicos para R:

Como importar arquivos Excel para R
Como importar arquivos TSV para R
Como importar arquivos Zip para R
Como importar arquivos SAS para R
Como importar arquivos .dta para R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *