Comment supprimer des colonnes dans R (avec exemples)



Souvent, vous souhaiterez peut-être supprimer une ou plusieurs colonnes d’un bloc de données dans R. Heureusement, cela est facile à faire en utilisant la fonction select() du package dplyr .

library(dplyr)

Ce didacticiel montre plusieurs exemples d’utilisation pratique de cette fonction à l’aide du bloc de données suivant :

#create data frame
df <- data.frame(player = c('a', 'b', 'c', 'd', 'e'),
                 position = c('G', 'F', 'F', 'G', 'G'),
                 points = c(12, 15, 19, 22, 32),
                 rebounds = c(5, 7, 7, 12, 11))

#view data frame
df

  player position points rebounds
1      a        G     12        5
2      b        F     15        7
3      c        F     19        7
4      d        G     22       12
5      e        G     32       11

Exemple 1 : supprimer des colonnes par nom

Le code suivant montre comment supprimer des colonnes d’un bloc de données par nom :

#remove column named 'points'
df %>% select(-points)

  player position rebounds
1      a        G        5
2      b        F        7
3      c        F        7
4      d        G       12
5      e        G       11

Exemple 2 : supprimer des colonnes dans la liste

Le code suivant montre comment supprimer les colonnes d’un bloc de données qui se trouvent dans une liste spécifique :

#remove columns named 'points' or 'rebounds'
df %>% select(-one_of('points', 'rebounds')) 

  player position
1      a        G
2      b        F
3      c        F
4      d        G
5      e        G

Exemple 3 : supprimer des colonnes dans la plage

Le code suivant montre comment supprimer toutes les colonnes de la plage allant de « position » à « rebonds » :

#remove columns in range from 'position' to 'rebounds'
df %>% select(-(position:rebounds)) 

  player
1      a
2      b
3      c
4      d
5      e

Exemple 4 : supprimer les colonnes contenant une expression

Le code suivant montre comment supprimer toutes les colonnes contenant le mot « points »

#remove columns that contain the word 'points'
df %>% select(-contains('points')) 

  player position rebounds
1      a        G        5
2      b        F        7
3      c        F        7
4      d        G       12
5      e        G       11

Exemple 5 : Supprimer les colonnes commençant par certaines lettres

Le code suivant montre comment supprimer toutes les colonnes commençant par les lettres « po » :

#remove columns that start with 'po'
df %>% select(-starts_with('po')) 

  player rebounds
1      a        5
2      b        7
3      c        7
4      d       12
5      e       11

Exemple 6 : Supprimer les colonnes qui se terminent par certaines lettres

Le code suivant montre comment supprimer toutes les colonnes se terminant par la lettre « s » :

#remove columns that end with 's'
df %>% select(-ends_with('s')) 

  player position
1      a        G
2      b        F
3      c        F
4      d        G
5      e        G

Exemple 7 : Supprimer des colonnes par position

Le code suivant montre comment supprimer des colonnes à des positions spécifiques :

#remove columns in position 1 and 4
df %>% select(-1, -4) 

  position points
1        G     12
2        F     15
3        F     19
4        G     22
5        G     32

Remarque : Vous pouvez trouver la documentation complète de la fonction select() ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes à l’aide de dplyr :

Comment supprimer des lignes à l’aide de dplyr
Comment supprimer des lignes avec des valeurs NA à l’aide de dplyr
Comment sélectionner des colonnes par index à l’aide de dplyr

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *