Como mesclar quadros de dados por nomes de linhas em r


Você pode usar a seguinte sintaxe básica para mesclar dois quadros de dados em R com base em seus nomes de linha:

 #inner join
merge(df1, df2, by= 0 )

#left join
merge(df1, df2, by= 0 , all. x = TRUE )

#outerjoin
merge(df1, df2, by= 0 , all= TRUE )

Usando o argumento by=0 , podemos dizer a R que queremos mesclar usando os nomes das linhas dos blocos de dados.

Os exemplos a seguir mostram como usar cada método com os dois quadros de dados a seguir:

 #create first data frame
df1 <- data. frame (points=c(99, 90, 86, 88, 95),
                  assists=c(33, 28, 31, 39, 34))

rownames(df1) <- c(1, 2, 3, 4, 5)

df1

  assist points
1 99 33
2 90 28
3 86 31
4 88 39
5 95 34

#create second data frame
df2 <- data. frame (rebounds=c(17, 15, 22, 26, 25),
                  blocks=c(7, 7, 15, 12, 14))

rownames(df2) <- c(3, 4, 5, 6, 7)

df2

  rebound blocks
3 17 7
4 15 7
5 22 15
6 26 12
7 25 14

Exemplo 1: Execute uma junção interna usando nomes de linhas

O código a seguir mostra como realizar uma junção interna em dois quadros de dados usando nomes de linhas:

 #perform inner join using row names
merge(df1, df2, by= 0 )

  Row.names points assists rebounds blocks
1 3 86 31 17 7
2 4 88 39 15 7
3 5 95 34 22 15

Observe que apenas as linhas cujos nomes pertencem a ambos os quadros de dados são retidas no quadro de dados mesclado final.

Exemplo 2: Execute uma junção à esquerda usando nomes de linhas

O código a seguir mostra como realizar uma junção à esquerda em dois quadros de dados usando nomes de linhas:

 #perform left join using row names
merge(df1, df2, by= 0 , all. x = TRUE )

  Row.names points assists rebounds blocks
1 1 99 33 NA NA
2 2 90 28 NA NA
3 3 86 31 17 7
4 4 88 39 15 7
5 5 95 34 22 15

Observe que todas as linhas do primeiro quadro de dados são retidas no quadro de dados mesclado final.

Exemplo 3: Execute uma junção externa usando nomes de linhas

O código a seguir mostra como realizar uma junção externa em dois quadros de dados usando nomes de linhas:

 #perform outer join using row names
merge(df1, df2, by= 0 , all= TRUE )

  Row.names points assists rebounds blocks
1 1 99 33 NA NA
2 2 90 28 NA NA
3 3 86 31 17 7
4 4 88 39 15 7
5 5 95 34 22 15
6 6 NA NA 26 12
7 7 NA NA 25 14

Observe que todas as linhas de ambos os quadros de dados são retidas no quadro de dados mesclado final.

Recursos adicionais

Os tutoriais a seguir explicam como executar outras funções comuns de quadro de dados em R:

Como fazer uma junção à esquerda no R
Como fazer um VLOOKUP em R
Como adicionar linhas ao quadro de dados em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *