Comment sélectionner des colonnes par index à l’aide de dplyr



Vous pouvez utiliser la syntaxe de base suivante dans dplyr pour sélectionner les colonnes du bloc de données par position d’index :

#select columns in specific index positions
df %>%
  select(1, 4, 5)

#exclude columns in specific index positions
df %>%
  select(-c(1,2))

Les exemples suivants montrent comment utiliser cette syntaxe en pratique avec le bloc de données suivant :

#create data frame
df <- data.frame(team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28),
                 blocks=c(14, 19, 22, 18, 15))

#view data frame
df

  team points assists rebounds blocks
1    A     99      33       30     14
2    B     90      28       28     19
3    C     86      31       24     22
4    D     88      39       24     18
5    E     95      34       28     15

Exemple 1 : sélectionner des colonnes dans des positions d’index spécifiques

Le code suivant montre comment sélectionner des colonnes dans des positions d’index spécifiques :

library(dplyr)

#select columns in position 1, 4, and 5
df %>%
  select(1, 4, 5)

  team rebounds blocks
1    A       30     14
2    B       28     19
3    C       24     22
4    D       24     18
5    E       28     15

Exemple 2 : sélectionner des colonnes dans la plage

Le code suivant montre comment sélectionner des colonnes dans une plage :

library(dplyr)

#select columns in position 2 through 4
df %>%
  select(2:4)

  points assists rebounds
1     99      33       30
2     90      28       28
3     86      31       24
4     88      39       24
5     95      34       28

Exemple 3 : exclure des colonnes spécifiques

Le code suivant montre comment exclure des colonnes spécifiques en fonction de la position de l’index :

library(dplyr)

#select all columns except those in position 1 and 2
df %>%
  select(-c(1, 2))

  assists rebounds blocks
1      33       30     14
2      28       28     19
3      31       24     22
4      39       24     18
5      34       28     15

Notez que la première et la deuxième colonne sont exclues.

Ressources additionnelles

Les didacticiels suivants expliquent comment exécuter d’autres fonctions courantes dans dplyr :

Comment sélectionner des colonnes par nom à l’aide de dplyr
Comment filtrer les lignes contenant une certaine chaîne à l’aide de dplyr
Comment sélectionner la première ligne par groupe à l’aide de dplyr
Comment remplacer NA par Zero dans dplyr

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *