R: exclua linhas do quadro de dados com base na condição


Você pode usar a função subset() para remover linhas com determinados valores em um quadro de dados em R:

 #only keep rows where col1 value is less than 10 and col2 value is less than 8
new_df <- subset(df, col1 < 10 & col2< 8 ) 

Os exemplos a seguir mostram como usar essa sintaxe na prática com o seguinte quadro de dados:

 #create data frame
df <- data. frame (a=c(1, 3, 4, 6, 8, 9),
                 b=c(7, 8, 8, 7, 13, 16),
                 c=c(11, 13, 13, 18, 19, 22),
                 d=c(12, 16, 18, 22, 29, 38))

#view data frame
df

  abcd
1 1 7 11 12
2 3 8 13 16
3 4 8 13 18
4 6 7 18 22
5 8 13 19 29
6 9 16 22 38

Exemplo 1: Excluir linhas iguais a um determinado valor

O código a seguir mostra como excluir todas as linhas cujo valor na coluna “c” seja igual a 13:

 #remove rows where column 'c' is equal to 13
new_df <- subset(df, c != 13) 

#view updated data frame
new_df

  abcd
1 1 7 11 12
4 6 7 18 22
5 8 13 19 29
6 9 16 22 38

Exemplo 2: Excluir linhas iguais a um de vários valores

O código a seguir mostra como excluir todas as linhas cujo valor na coluna “b” seja igual a 7 ou 8:

 #remove rows where value in column b is equal to 7 or 8
new_df <- subset(df, ! (b %in% c(7, 8)))

#view updated data frame
new_df

  abcd
5 8 13 19 29
6 9 16 22 38

Exemplo 3: Excluir linhas com base em diversas condições

O código a seguir mostra como excluir todas as linhas onde o valor da coluna “b” é igual a 7 ou onde o valor da coluna “d” é igual a 38:

 #remove rows where value in column b is 7 or value in column d is 38
new_df <- subset(df, b != 7 & d != 38)

#view updated data frame
new_df

  abcd
2 3 8 13 16
3 4 8 13 18
5 8 13 19 29

Recursos adicionais

Como remover linhas duplicadas em R
Como usar o operador %in% em R
Como recodificar valores em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *