Comment supprimer plusieurs colonnes dans R (avec exemples)
Souvent, vous souhaiterez peut-être supprimer plusieurs colonnes à la fois d’un bloc de données dans R.
La manière la plus simple de procéder consiste à utiliser la syntaxe suivante :
df[ , c('column_name1', 'column_name2')] <- list(NULL)
Par exemple, la syntaxe suivante montre comment supprimer les colonnes 2 et 3 d’un bloc de données donné :
#create data frame df <- data.frame(var1=c(1, 3, 2, 9, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 7)) #delete columns 2 and 3 from data frame df[ , c('var2', 'var3')] <- list(NULL) #view data frame df var1 var4 1 1 1 2 3 1 3 2 2 4 9 8 5 5 7
On peut également supprimer des colonnes en fonction de leur index :
#create data frame df <- data.frame(var1=c(1, 3, 2, 9, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 7)) #delete columns in position 2 and 3 df[ , c(2, 3)] <- list(NULL) #view data frame df var1 var4 1 1 1 2 3 1 3 2 2 4 9 8 5 5 7
Et nous pouvons utiliser la syntaxe suivante pour supprimer toutes les colonnes d’une plage :
#create data frame df <- data.frame(var1=c(1, 3, 2, 9, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 7)) #delete columns in range 1 through 3 df[ , 1:3] <- list(NULL) #view data frame df var4 1 1 2 1 3 2 4 8 5 7
En général, il est recommandé de supprimer les colonnes par leur nom plutôt que par leur position simplement parce que si vous ajoutez ou réorganisez des colonnes, les positions pourraient changer.
En utilisant des noms de colonnes, vous vous assurez de supprimer les colonnes correctes, quelle que soit leur position.
Ressources additionnelles
Comment parcourir les noms de colonnes dans R
Comment combiner deux colonnes en une seule dans R
Comment supprimer les valeurs aberrantes de plusieurs colonnes dans R