Como filtrar valores únicos usando dplyr


Você pode usar os seguintes métodos para filtrar valores exclusivos em um quadro de dados em R usando o pacote dplyr :

Método 1: Filtrar valores exclusivos em uma coluna

 df %>% distinct(var1)

Método 2: Filtrar valores únicos em múltiplas colunas

 df %>% distinct(var1, var2)

Método 3: Filtre valores exclusivos em todas as colunas

 df %>% distinct()

Os exemplos a seguir mostram como usar cada método na prática com o seguinte quadro de dados em R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 to 10 8
3 to 8 4
4 to 6 3
5 B 15 10
6 B 15 11
7 B 12 7
8 B 12 7

Exemplo 1: Filtrar valores exclusivos na coluna

Podemos usar o seguinte código para filtrar valores exclusivos apenas na coluna da equipe :

 library (dplyr)

#select only unique values in team column
df %>% distinct(team)

  team
1A
2 B

Observe que apenas valores exclusivos da coluna da equipe são retornados.

Exemplo 2: Filtrar valores únicos em múltiplas colunas

Podemos usar o seguinte código para filtrar valores exclusivos nas colunas de equipe e pontos :

 library (dplyr)

#select unique values in team and points columns
df %>% distinct(team, points)

  team points
1 to 10
2 to 8
3 to 6
4 B 15
5 B 12

Observe que apenas valores exclusivos das colunas equipe e pontos são retornados.

Exemplo 3: Filtrar valores únicos em todas as colunas

Podemos usar o seguinte código para filtrar valores exclusivos em todas as colunas do quadro de dados:

 library (dplyr)

#select unique values across all columns
df %>% distinct()

  team points rebounds
1 to 10 8
2 to 8 4
3 to 6 3
4 B 15 10
5 B 15 11
6 B 12 7

Observe que os valores exclusivos de todas as três colunas são retornados.

Nota : Você pode encontrar a documentação completa da função separada no dplyr aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns no dplyr:

Como selecionar colunas por índice usando dplyr
Como selecionar a primeira linha por grupo usando dplyr
Como filtrar por múltiplas condições usando dplyr
Como filtrar linhas contendo uma determinada string usando dplyr

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *