Como excluir várias colunas em r (com exemplos)
Freqüentemente, você pode querer excluir várias colunas de uma vez de um quadro de dados em R.
A maneira mais simples de fazer isso é usar a seguinte sintaxe:
df[, c('column_name1', 'column_name2')] <- list(NULL)
Por exemplo, a sintaxe a seguir mostra como remover as colunas 2 e 3 de um determinado quadro de dados:
#create data frame df <- data.frame(var1=c(1, 3, 2, 9, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 7)) #delete columns 2 and 3 from data frame df[, c('var2', 'var3')] <- list(NULL) #view data frame df var1 var4 1 1 1 2 3 1 3 2 2 4 9 8 5 5 7
Você também pode excluir colunas com base em seu índice:
#create data frame df <- data.frame(var1=c(1, 3, 2, 9, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 7)) #delete columns in position 2 and 3 df[, c(2, 3)] <- list(NULL) #view data frame df var1 var4 1 1 1 2 3 1 3 2 2 4 9 8 5 5 7
E podemos usar a seguinte sintaxe para remover todas as colunas de um intervalo:
#create data frame df <- data.frame(var1=c(1, 3, 2, 9, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 7)) #delete columns in range 1 through 3 df[, 1:3] <- list(NULL) #view data frame df var4 1 1 2 1 3 2 4 8 5 7
Em geral, é recomendado excluir colunas por nome e não por posição, simplesmente porque se você adicionar ou reorganizar colunas, as posições poderão mudar.
Ao usar nomes de colunas, você garante a exclusão das colunas corretas, independentemente de sua posição.
Recursos adicionais
Como iterar sobre nomes de colunas em R
Como combinar duas colunas em uma em R
Como remover outliers de múltiplas colunas em R