Comment supprimer des colonnes dans R (avec exemples)
Souvent, vous souhaiterez peut-être supprimer une ou plusieurs colonnes d’un bloc de données dans R. Heureusement, cela est facile à faire en utilisant la fonction select() du package dplyr .
library(dplyr)
Ce didacticiel montre plusieurs exemples d’utilisation pratique de cette fonction à l’aide du bloc de données suivant :
#create data frame df <- data.frame(player = c('a', 'b', 'c', 'd', 'e'), position = c('G', 'F', 'F', 'G', 'G'), points = c(12, 15, 19, 22, 32), rebounds = c(5, 7, 7, 12, 11)) #view data frame df player position points rebounds 1 a G 12 5 2 b F 15 7 3 c F 19 7 4 d G 22 12 5 e G 32 11
Exemple 1 : supprimer des colonnes par nom
Le code suivant montre comment supprimer des colonnes d’un bloc de données par nom :
#remove column named 'points'
df %>% select(-points)
player position rebounds
1 a G 5
2 b F 7
3 c F 7
4 d G 12
5 e G 11
Exemple 2 : supprimer des colonnes dans la liste
Le code suivant montre comment supprimer les colonnes d’un bloc de données qui se trouvent dans une liste spécifique :
#remove columns named 'points' or 'rebounds' df %>% select(-one_of('points', 'rebounds')) player position 1 a G 2 b F 3 c F 4 d G 5 e G
Exemple 3 : supprimer des colonnes dans la plage
Le code suivant montre comment supprimer toutes les colonnes de la plage allant de « position » à « rebonds » :
#remove columns in range from 'position' to 'rebounds'
df %>% select(-(position:rebounds))
player
1 a
2 b
3 c
4 d
5 e
Exemple 4 : supprimer les colonnes contenant une expression
Le code suivant montre comment supprimer toutes les colonnes contenant le mot « points »
#remove columns that contain the word 'points' df %>% select(-contains('points')) player position rebounds 1 a G 5 2 b F 7 3 c F 7 4 d G 12 5 e G 11
Exemple 5 : Supprimer les colonnes commençant par certaines lettres
Le code suivant montre comment supprimer toutes les colonnes commençant par les lettres « po » :
#remove columns that start with 'po' df %>% select(-starts_with('po')) player rebounds 1 a 5 2 b 7 3 c 7 4 d 12 5 e 11
Exemple 6 : Supprimer les colonnes qui se terminent par certaines lettres
Le code suivant montre comment supprimer toutes les colonnes se terminant par la lettre « s » :
#remove columns that end with 's' df %>% select(-ends_with('s')) player position 1 a G 2 b F 3 c F 4 d G 5 e G
Exemple 7 : Supprimer des colonnes par position
Le code suivant montre comment supprimer des colonnes à des positions spécifiques :
#remove columns in position 1 and 4
df %>% select(-1, -4)
position points
1 G 12
2 F 15
3 F 19
4 G 22
5 G 32
Remarque : Vous pouvez trouver la documentation complète de la fonction select() ici .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes à l’aide de dplyr :
Comment supprimer des lignes à l’aide de dplyr
Comment supprimer des lignes avec des valeurs NA à l’aide de dplyr
Comment sélectionner des colonnes par index à l’aide de dplyr