Como usar a função gather em r (com exemplos)
A função Gather() do pacote Tidyr pode ser usada para “reunir” um par chave-valor em múltiplas colunas.
Esta função usa a seguinte sintaxe básica:
coletar (dados, valor-chave, etc.)
Ouro:
- data : nome do quadro de dados
- key : Nome da coluna-chave a ser criada
- valor : nome da coluna de valor a ser criada
- … : Especifique as colunas das quais coletar
Os exemplos a seguir mostram como usar esta função na prática.
Exemplo 1: Colete os valores de duas colunas
Suponha que temos o seguinte quadro de dados em R:
#create data frame df <- data. frame (player=c('A', 'B', 'C', 'D'), year1=c(12, 15, 19, 19), year2=c(22, 29, 18, 12)) #view data frame df player year1 year2 1 to 12 22 2 B 15 29 3 C 19 18 4 D 19 12
Podemos usar a função reunir() para criar duas novas colunas chamadas “ano” e “pontos” da seguinte forma:
library (tidyr) #gather data from columns 2 and 3 gather(df, key=" year ", value=" points ", 2:3) player year points 1 A year1 12 2 B year1 15 3 C year1 19 4 D year1 19 5 A year2 22 6 B year2 29 7 C year2 18 8 D year2 12
Exemplo 2: Colete valores de mais de duas colunas
Suponha que temos o seguinte quadro de dados em R:
#create data frame df2 <- data. frame (player=c('A', 'B', 'C', 'D'), year1=c(12, 15, 19, 19), year2=c(22, 29, 18, 12), year3=c(17, 17, 22, 25)) #view data frame df2 player year1 year2 year3 1 A 12 22 17 2 B 15 29 17 3 C 19 18 22 4 D 19 12 25
Podemos usar a função reunir() para “reunir” os valores das colunas 2, 3 e 4 em duas novas colunas chamadas “ano” e “pontos” da seguinte forma:
library (tidyr) #gather data from columns 2, 3, and 4 gather(df, key=" year ", value=" points ", 2:4) player year points 1 A year1 12 2 B year1 15 3 C year1 19 4 D year1 19 5 A year2 22 6 B year2 29 7 C year2 18 8 D year2 12 9 A year3 17 10 B year3 17 11 C year3 22 12 D year3 25
Recursos adicionais
O objetivo do pacote Tidyr é criar dados “organizados”, que possuem as seguintes características:
- Cada coluna é uma variável.
- Cada linha é uma observação.
- Cada célula é um valor único.
O pacote Tidyr usa quatro funções principais para criar dados ordenados:
1. A função spread() .
2. A função reunir() .
3. A função separada() .
4. A função unit() .
Se você dominar essas quatro funções, será capaz de criar dados “organizados” a partir de qualquer quadro de dados.