Comment utiliser colClasses pour importer rapidement des données dans R



Vous pouvez utiliser l’argument colClasses lors de l’importation d’un fichier dans R pour spécifier les classes de chaque colonne :

df <- read.csv('my_data.csv',
               colClasses=c('character', 'numeric', 'numeric'))

L’avantage de l’utilisation de colClasses est que vous pouvez importer des données beaucoup plus rapidement, surtout lorsque les fichiers sont extrêmement volumineux.

L’exemple suivant montre comment utiliser cet argument dans la pratique.

Exemple : utiliser des colClasses lors de l’importation de fichiers

Supposons que j’ai un fichier CSV appelé my_data.csv avec trois colonnes que j’aimerais importer dans R :

Je peux utiliser la syntaxe suivante pour ce faire :

#import CSV file
df <- read.csv('my_data.csv',
               colClasses=c('character', 'numeric', 'numeric'))

#view class of each column in data frame
str(df)

'data.frame':	14 obs. of  3 variables:
 $ team    : chr  "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points  : num  91 99 104 103 105 88 89 93 96 99 ...
 $ rebounds: num  33 23 26 25 25 26 29 30 34 23 ...

Notez que le nombre de valeurs dans l’argument colClasses doit correspondre au nombre de colonnes dans le bloc de données.

Par exemple, si vous ne fournissez qu’une seule valeur à l’argument colClasses , chaque colonne du bloc de données aura la même classe :

#import CSV file
df <- read.csv('my_data.csv',
               colClasses=c('character'))

#view class of each column in data frame
str(df)

'data.frame':	14 obs. of  3 variables:
 $ team    : chr  "Mavs" "Spurs" "Hornets" "Rockets" ...
 $ points  : chr  "91" "99" "104" "103" ...
 $ rebounds: chr  "33" "23" "26" "25" ...

Notez que chaque colonne du bloc de données résultant a une classe « caractère » puisque nous n’avons fourni qu’une seule valeur à l’argument colClasses .

Notez que vous pouvez spécifier les classes potentielles suivantes dans l’argument colClasses :

  • personnage : « hé », « là », « monde »
  • complexe : as.complex(-1), 4i
  • numérique : as.integer(20), 3L
  • entier : 4, 12, 158
  • logique : VRAI, FAUX

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans R :

Comment saisir manuellement des données brutes dans R
Comment importer des fichiers CSV dans R
Comment importer des fichiers Excel dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *