R: como encontrar linhas exclusivas em várias colunas
Você pode usar os seguintes métodos para encontrar linhas exclusivas em várias colunas de um quadro de dados em R:
Método 1: Encontre linhas exclusivas em várias colunas (remova outras colunas)
df_unique <- unique(df[c(' col1 ', ' col2 ')])
Método 2: Encontre linhas exclusivas em várias colunas (mantenha outras colunas)
df_unique <- df[!duplicated(df[c(' col1 ', ' col2 ')]),]
Os exemplos a seguir mostram como usar cada um desses métodos na prática com o seguinte quadro de dados:
#create data frame
df <- data. frame (conf=c('East', 'East', 'East', 'West', 'West', 'West'),
pos=c('G', 'G', 'F', 'G', 'F', 'F'),
dots=c(33, 28, 31, 39, 34, 40))
#view data frame
df
conf pos points
1 East G 33
2 East G 28
3 East F 31
4 West G 39
5 West F 34
6 West F 40
Método 1: Encontre linhas exclusivas em várias colunas (remova outras colunas)
O código a seguir mostra como encontrar linhas exclusivas nas colunas conf e pos do quadro de dados:
#find unique rows across conf and pos columns
df_unique <- unique(df[c(' conf ', ' pos ')])
#view results
df_unique
conf pos
1 East G
3 East
4 West G
5 West
O resultado são quatro linhas exclusivas.
Observe também que a coluna de pontos foi removida automaticamente dos resultados.
Método 2: encontrar linhas únicas em várias colunas (remover outras colunas)
O código a seguir mostra como encontrar linhas únicas nas colunas conf e pos do quadro de dados e manter os valores na coluna de pontos :
#find unique rows across conf and pos columns
df_unique <- df[!duplicated(df[c(' conf ', ' pos ')]),]
#view results
df_unique
conf pos points
1 East G 33
3 East F 31
4 West G 39
5 West F 34
Observe que existem apenas linhas únicas nas colunas conf e pos e os valores na coluna de pontos são preservados.
É importante observar que apenas o valor da primeira ocorrência única é retido.
Por exemplo, havia duas linhas contendo “Leste” e “G” nas duas primeiras colunas, mas apenas o valor do ponto (33) para a primeira ocorrência desta combinação única foi retido no quadro de dados final.
Da mesma forma, havia duas linhas contendo “Oeste” e “F” nas duas primeiras colunas, mas apenas o valor do ponto (34) para a primeira ocorrência desta combinação única foi retido no quadro de dados final.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:
Como encontrar valores únicos em uma coluna em R
Como contar valores únicos por grupo em R
Como filtrar valores únicos usando dplyr