R: como encontrar linhas exclusivas em várias colunas


Você pode usar os seguintes métodos para encontrar linhas exclusivas em várias colunas de um quadro de dados em R:

Método 1: Encontre linhas exclusivas em várias colunas (remova outras colunas)

 df_unique <- unique(df[c(' col1 ', ' col2 ')])

Método 2: Encontre linhas exclusivas em várias colunas (mantenha outras colunas)

 df_unique <- df[!duplicated(df[c(' col1 ', ' col2 ')]),]

Os exemplos a seguir mostram como usar cada um desses métodos na prática com o seguinte quadro de dados:

 #create data frame
df <- data. frame (conf=c('East', 'East', 'East', 'West', 'West', 'West'),
                 pos=c('G', 'G', 'F', 'G', 'F', 'F'),
                 dots=c(33, 28, 31, 39, 34, 40))

#view data frame
df

  conf pos points
1 East G 33
2 East G 28
3 East F 31
4 West G 39
5 West F 34
6 West F 40

Método 1: Encontre linhas exclusivas em várias colunas (remova outras colunas)

O código a seguir mostra como encontrar linhas exclusivas nas colunas conf e pos do quadro de dados:

 #find unique rows across conf and pos columns
df_unique <- unique(df[c(' conf ', ' pos ')])

#view results
df_unique 

  conf pos
1 East G
3 East
4 West G
5 West

O resultado são quatro linhas exclusivas.

Observe também que a coluna de pontos foi removida automaticamente dos resultados.

Método 2: encontrar linhas únicas em várias colunas (remover outras colunas)

O código a seguir mostra como encontrar linhas únicas nas colunas conf e pos do quadro de dados e manter os valores na coluna de pontos :

 #find unique rows across conf and pos columns
df_unique <- df[!duplicated(df[c(' conf ', ' pos ')]),]

#view results
df_unique 

  conf pos points
1 East G 33
3 East F 31
4 West G 39
5 West F 34

Observe que existem apenas linhas únicas nas colunas conf e pos e os valores na coluna de pontos são preservados.

É importante observar que apenas o valor da primeira ocorrência única é retido.

Por exemplo, havia duas linhas contendo “Leste” e “G” nas duas primeiras colunas, mas apenas o valor do ponto (33) para a primeira ocorrência desta combinação única foi retido no quadro de dados final.

Da mesma forma, havia duas linhas contendo “Oeste” e “F” nas duas primeiras colunas, mas apenas o valor do ponto (34) para a primeira ocorrência desta combinação única foi retido no quadro de dados final.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:

Como encontrar valores únicos em uma coluna em R
Como contar valores únicos por grupo em R
Como filtrar valores únicos usando dplyr

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *