Comment sélectionner des colonnes spécifiques dans R : avec des exemples
Vous pouvez utiliser la syntaxe suivante pour sélectionner des colonnes spécifiques dans un bloc de données en base R :
#select columns by name df[c('col1', 'col2', 'col4')] #select columns by index df[c(1, 2, 4)]
Alternativement, vous pouvez utiliser la fonction select() du package dplyr :
library(dplyr) #select columns by name df %>% select(col1, col2, col4) #select columns by index df %>% select(1, 2, 4)
Pour les ensembles de données extrêmement volumineux, il est recommandé d’utiliser la méthode dplyr car la fonction select() a tendance à être plus rapide que les fonctions en base R.
Les exemples suivants montrent comment utiliser ces deux méthodes en pratique avec le bloc de données suivant :
#create data frame df <- data.frame(a=c(1, 3, 4, 6, 8, 9), b=c(7, 8, 8, 7, 13, 16), c=c(11, 13, 13, 18, 19, 22), d=c(12, 16, 18, 22, 29, 38)) #view data frame df a b c d 1 1 7 11 12 2 3 8 13 16 3 4 8 13 18 4 6 7 18 22 5 8 13 19 29 6 9 16 22 38
Exemple 1 : sélectionner des colonnes spécifiques à l’aide de Base R (par nom)
Le code suivant montre comment sélectionner des colonnes spécifiques par nom en utilisant la base R :
#select columns by name df[c('a', 'b', 'd')] a b d 1 1 7 12 2 3 8 16 3 4 8 18 4 6 7 22 5 8 13 29 6 9 16 38
Exemple 2 : sélectionner des colonnes spécifiques à l’aide de la base R (par index)
Le code suivant montre comment sélectionner des colonnes spécifiques par index en utilisant la base R :
#select columns by index
df[c(1, 2, 4)]
a b d
1 1 7 12
2 3 8 16
3 4 8 18
4 6 7 22
5 8 13 29
6 9 16 38
Exemple 3 : sélectionner des colonnes spécifiques à l’aide de dplyr (par nom)
Le code suivant montre comment sélectionner des colonnes spécifiques par nom à l’aide de dplyr :
library(dplyr)
#select columns by name
df %>%
select(a, b, d)
a b d
1 1 7 12
2 3 8 16
3 4 8 18
4 6 7 22
5 8 13 29
6 9 16 38
Exemple 4 : sélectionner des colonnes spécifiques à l’aide de dplyr (par index)
Le code suivant montre comment sélectionner des colonnes spécifiques par index à l’aide de dplyr :
library(dplyr)
#select columns by index
df %>%
select(1, 2, 4)
a b d
1 1 7 12
2 3 8 16
3 4 8 18
4 6 7 22
5 8 13 29
6 9 16 38
Ressources additionnelles
Comment ajouter une colonne à un bloc de données dans R
Comment parcourir les noms de colonnes dans R
Comment trier un bloc de données par colonne dans R