Comment supprimer plusieurs colonnes à l’aide de dplyr (avec exemples)



Vous pouvez utiliser l’une des méthodes suivantes pour supprimer plusieurs colonnes d’un bloc de données dans R à l’aide du package dplyr :

1. Supprimez plusieurs colonnes par nom

df_new <- df %>% select(-c(col2, col4))

2. Supprimez toutes les colonnes de la plage

df_new <- df %>% select(-c(col2:col4))

Les exemples suivants montrent comment utiliser chacune de ces méthodes en pratique avec le bloc de données suivant :

#create data frame
df = data.frame(rating = c(90, 85, 82, 88, 94, 90, 76, 75, 87, 86),
                points=c(25, 20, 14, 16, 27, 20, 12, 15, 14, 19),
                assists=c(5, 7, 7, 8, 5, 7, 6, 9, 9, 5),
                rebounds=c(11, 8, 10, 6, 6, 9, 6, 10, 10, 7))

#view data frame
df

   rating points assists rebounds
1      90     25       5       11
2      85     20       7        8
3      82     14       7       10
4      88     16       8        6
5      94     27       5        6
6      90     20       7        9
7      76     12       6        6
8      75     15       9       10
9      87     14       9       10
10     86     19       5        7

Exemple 1 : supprimer plusieurs colonnes par nom

Le code suivant montre comment supprimer les colonnes nommées points et rebonds du bloc de données :

library(dplyr)

#drop points and rebounds columns
df_new <- df %>% select(-c(points, rebounds))

#view new data frame
new_df

   rating assists
1      90       5
2      85       7
3      82       7
4      88       8
5      94       5
6      90       7
7      76       6
8      75       9
9      87       9
10     86       5

Notez que les colonnes nommées points et rebonds ont toutes deux été supprimées du nouveau bloc de données.

Exemple 2 : supprimer toutes les colonnes de la plage

Le code suivant montre comment supprimer toutes les colonnes situées entre les colonnes de points et de rebonds :

library(dplyr)

#drop all columns between points and rebounds
df_new <- df %>% select(-c(points:rebounds))

#view new data frame
new_df

   rating
1      90
2      85
3      82
4      88
5      94
6      90
7      76
8      75
9      87
10     86

Notez que toutes les colonnes entre les points et les rebonds ont été supprimées du nouveau bloc de données.

Remarque : Le package MASS dans R possède également une fonction select() . Si ce package est également chargé, vous devez utiliser dplyr::select() pour que R sache utiliser la fonction select() du package dplyr .

Ressources additionnelles

Les didacticiels suivants expliquent comment exécuter d’autres fonctions courantes dans dplyr :

Comment sélectionner des colonnes par index à l’aide de dplyr
Comment renommer plusieurs colonnes à l’aide de dplyr
Comment remplacer une chaîne dans une colonne à l’aide de dplyr

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *