Comment sélectionner des colonnes par nom à l’aide de dplyr



Vous pouvez utiliser les méthodes suivantes pour sélectionner les colonnes d’un bloc de données par nom dans R à l’aide du package dplyr :

Méthode 1 : sélectionner des colonnes spécifiques par nom

df %>% select(var1, var3)

Méthode 2 : sélectionner une plage de colonnes par nom

df %>% select(var1:var3)

Méthode 3 : sélectionner toutes les colonnes sauf certaines colonnes

df %>% select(-c(var1, var3))

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le bloc de données suivant dans R :

#create data frame
df <- data.frame(points=c(1, 5, 4, 5, 5, 7, 8),
                 rebounds=c(10, 3, 3, 2, 6, 7, 12),
                 assists=c(5, 5, 7, 6, 7, 9, 15),
                 blocks=c(1, 1, 0, 4, 3, 2, 10))

#view data frame
df

  points rebounds assists blocks
1      1       10       5      1
2      5        3       5      1
3      4        3       7      0
4      5        2       6      4
5      5        6       7      3
6      7        7       9      2
7      8       12      15     10

Exemple 1 : sélectionner des colonnes spécifiques par nom

Nous pouvons utiliser le code suivant pour sélectionner uniquement les colonnes de points et de passes décisives :

library(dplyr)

#select only points and assists columns
df %>% select(points, assists)

  points assists
1      1       5
2      5       5
3      4       7
4      5       6
5      5       7
6      7       9
7      8      15

Notez que seules les colonnes de points et de passes décisives sont renvoyées.

Exemple 2 : sélectionner une plage de colonnes par nom

Nous pouvons utiliser le code suivant pour sélectionner toutes les colonnes entre les noms points et passes décisives .

library(dplyr)

#select all columns between points and assists
df %>% select(points:assists)

  points rebounds assists
1      1       10       5
2      5        3       5
3      4        3       7
4      5        2       6
5      5        6       7
6      7        7       9
7      8       12      15

Une plage de colonnes est renvoyée, en commençant par la colonne des points et en terminant par la colonne des passes décisives .

Exemple 3 : sélectionner toutes les colonnes sauf certaines colonnes

Nous pouvons utiliser le code suivant pour sélectionner toutes les colonnes à l’exception des colonnes de points et de passes décisives .

library(dplyr)

#select all columns except points and assists columns
df %>% select(-c(points, assists))

  rebounds blocks
1       10      1
2        3      1
3        3      0
4        2      4
5        6      3
6        7      2
7       12     10

Toutes les colonnes sont renvoyées à l’exception des colonnes de points et de passes décisives .

Remarque : Vous pouvez trouver la documentation complète de la fonction select dans dplyr ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans dplyr :

Comment sélectionner des colonnes par index à l’aide de dplyr
Comment sélectionner la première ligne par groupe à l’aide de dplyr

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *