Como usar a função gather em r (com exemplos)


A função Gather() do pacote Tidyr pode ser usada para “reunir” um par chave-valor em múltiplas colunas.

Esta função usa a seguinte sintaxe básica:

coletar (dados, valor-chave, etc.)

Ouro:

  • data : nome do quadro de dados
  • key : Nome da coluna-chave a ser criada
  • valor : nome da coluna de valor a ser criada
  • : Especifique as colunas das quais coletar

Os exemplos a seguir mostram como usar esta função na prática.

Exemplo 1: Colete os valores de duas colunas

Suponha que temos o seguinte quadro de dados em R:

 #create data frame
df <- data. frame (player=c('A', 'B', 'C', 'D'),
                 year1=c(12, 15, 19, 19),
                 year2=c(22, 29, 18, 12))

#view data frame
df

  player year1 year2
1 to 12 22
2 B 15 29
3 C 19 18
4 D 19 12

Podemos usar a função reunir() para criar duas novas colunas chamadas “ano” e “pontos” da seguinte forma:

 library (tidyr)

#gather data from columns 2 and 3
gather(df, key=" year ", value=" points ", 2:3)

  player year points
1 A year1 12
2 B year1 15
3 C year1 19
4 D year1 19
5 A year2 22
6 B year2 29
7 C year2 18
8 D year2 12

Exemplo 2: Colete valores de mais de duas colunas

Suponha que temos o seguinte quadro de dados em R:

 #create data frame
df2 <- data. frame (player=c('A', 'B', 'C', 'D'),
                  year1=c(12, 15, 19, 19),
                  year2=c(22, 29, 18, 12),
                  year3=c(17, 17, 22, 25))

#view data frame
df2

  player year1 year2 year3
1 A 12 22 17
2 B 15 29 17
3 C 19 18 22
4 D 19 12 25

Podemos usar a função reunir() para “reunir” os valores das colunas 2, 3 e 4 em duas novas colunas chamadas “ano” e “pontos” da seguinte forma:

 library (tidyr)

#gather data from columns 2, 3, and 4
gather(df, key=" year ", value=" points ", 2:4)

   player year points
1 A year1 12
2 B year1 15
3 C year1 19
4 D year1 19
5 A year2 22
6 B year2 29
7 C year2 18
8 D year2 12
9 A year3 17
10 B year3 17
11 C year3 22
12 D year3 25

Recursos adicionais

O objetivo do pacote Tidyr é criar dados “organizados”, que possuem as seguintes características:

  • Cada coluna é uma variável.
  • Cada linha é uma observação.
  • Cada célula é um valor único.

O pacote Tidyr usa quatro funções principais para criar dados ordenados:

1. A função spread() .

2. A função reunir() .

3. A função separada() .

4. A função unit() .

Se você dominar essas quatro funções, será capaz de criar dados “organizados” a partir de qualquer quadro de dados.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *