Como excluir várias colunas em r (com exemplos)


Freqüentemente, você pode querer excluir várias colunas de uma vez de um quadro de dados em R.

A maneira mais simples de fazer isso é usar a seguinte sintaxe:

 df[, c('column_name1', 'column_name2')] <- list(NULL)

Por exemplo, a sintaxe a seguir mostra como remover as colunas 2 e 3 de um determinado quadro de dados:

 #create data frame
df <- data.frame(var1=c(1, 3, 2, 9, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 7))

#delete columns 2 and 3 from data frame
df[, c('var2', 'var3')] <- list(NULL)

#view data frame
df

  var1 var4
1 1 1
2 3 1
3 2 2
4 9 8
5 5 7

Você também pode excluir colunas com base em seu índice:

 #create data frame
df <- data.frame(var1=c(1, 3, 2, 9, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 7))

#delete columns in position 2 and 3
df[, c(2, 3)] <- list(NULL)

#view data frame
df

  var1 var4
1 1 1
2 3 1
3 2 2
4 9 8
5 5 7

E podemos usar a seguinte sintaxe para remover todas as colunas de um intervalo:

 #create data frame
df <- data.frame(var1=c(1, 3, 2, 9, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 7))

#delete columns in range 1 through 3
df[, 1:3] <- list(NULL)

#view data frame
df

  var4
1 1
2 1
3 2
4 8
5 7

Em geral, é recomendado excluir colunas por nome e não por posição, simplesmente porque se você adicionar ou reorganizar colunas, as posições poderão mudar.

Ao usar nomes de colunas, você garante a exclusão das colunas corretas, independentemente de sua posição.

Recursos adicionais

Como iterar sobre nomes de colunas em R
Como combinar duas colunas em uma em R
Como remover outliers de múltiplas colunas em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *