Comment sélectionner des colonnes spécifiques dans R : avec des exemples



Vous pouvez utiliser la syntaxe suivante pour sélectionner des colonnes spécifiques dans un bloc de données en base R :

#select columns by name
df[c('col1', 'col2', 'col4')]

#select columns by index
df[c(1, 2, 4)]

Alternativement, vous pouvez utiliser la fonction select() du package dplyr :

library(dplyr)

#select columns by name
df %>%
  select(col1, col2, col4)

#select columns by index
df %>%
  select(1, 2, 4)

Pour les ensembles de données extrêmement volumineux, il est recommandé d’utiliser la méthode dplyr car la fonction select() a tendance à être plus rapide que les fonctions en base R.

Les exemples suivants montrent comment utiliser ces deux méthodes en pratique avec le bloc de données suivant :

#create data frame
df <- data.frame(a=c(1, 3, 4, 6, 8, 9),
                 b=c(7, 8, 8, 7, 13, 16),
                 c=c(11, 13, 13, 18, 19, 22),
                 d=c(12, 16, 18, 22, 29, 38))

#view data frame
df

  a  b  c  d
1 1  7 11 12
2 3  8 13 16
3 4  8 13 18
4 6  7 18 22
5 8 13 19 29
6 9 16 22 38

Exemple 1 : sélectionner des colonnes spécifiques à l’aide de Base R (par nom)

Le code suivant montre comment sélectionner des colonnes spécifiques par nom en utilisant la base R :

#select columns by name
df[c('a', 'b', 'd')]

  a  b  d
1 1  7 12
2 3  8 16
3 4  8 18
4 6  7 22
5 8 13 29
6 9 16 38

Exemple 2 : sélectionner des colonnes spécifiques à l’aide de la base R (par index)

Le code suivant montre comment sélectionner des colonnes spécifiques par index en utilisant la base R :

#select columns by index
df[c(1, 2, 4)]

  a  b  d
1 1  7 12
2 3  8 16
3 4  8 18
4 6  7 22
5 8 13 29
6 9 16 38

Exemple 3 : sélectionner des colonnes spécifiques à l’aide de dplyr (par nom)

Le code suivant montre comment sélectionner des colonnes spécifiques par nom à l’aide de dplyr :

library(dplyr)

#select columns by name
df %>%
  select(a, b, d)

  a  b  d
1 1  7 12
2 3  8 16
3 4  8 18
4 6  7 22
5 8 13 29
6 9 16 38

Exemple 4 : sélectionner des colonnes spécifiques à l’aide de dplyr (par index)

Le code suivant montre comment sélectionner des colonnes spécifiques par index à l’aide de dplyr :

library(dplyr)

#select columns by index
df %>%
  select(1, 2, 4)

  a  b  d
1 1  7 12
2 3  8 16
3 4  8 18
4 6  7 22
5 8 13 29
6 9 16 38

Ressources additionnelles

Comment ajouter une colonne à un bloc de données dans R
Comment parcourir les noms de colonnes dans R
Comment trier un bloc de données par colonne dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *