Como organizar linhas em r


Freqüentemente, você pode querer organizar as linhas de um quadro de dados em R em uma ordem específica. Felizmente, isso é fácil de fazer usando a função organize() da biblioteca dplyr .

Este tutorial explica vários exemplos de uso prático desta função usando o seguinte data frame:

 #create data frame
df <- data.frame(player = c('A', 'B', 'C', 'D', 'E', 'F', 'G'),
                 points = c(12, 14, 14, 15, 20, 18, 29),
                 assists = c(3, 5, 7, 8, 14, NA, 9))

#view data frame 
df

  player points assists
1 to 12 3
2 B 14 5
3 C 14 7
4 D 15 8
5 E 20 14
6 F 18 NA
7 G 29 9

Exemplo 1: Organizar por coluna

O código a seguir mostra como organizar o quadro de dados em ordem crescente com base nos valores da coluna “pontos”:

 library(dplyr)

df %>% arrange(points)

  player points assists
1 to 12 3
2 B 14 5
3 C 14 7
4 D 15 8
5 F 18 NA
6 E 20 14
7 G 29 9

Para classificar em ordem decrescente, você pode usar a função desc() :

 df %>% arrange( desc (dots))

  player points assists
1 G 29 9
2 E 20 14
3 F 18 NA
4 D 15 8
5 B 14 5
6 C 14 5
7 to 12 3

Observe que os NAs serão classificados até o final, independentemente de você classificar ou não em ordem crescente ou decrescente:

 df %>% arrange(assists)

  player points assists
1 to 12 3
2 B 14 5
3 C 14 7
4 D 15 8
5 G 29 9
6 E 20 14
7 F 18 NA

df %>% arrange( desc (assists))

  player points assists
1 E 20 14
2 G 29 9
3 D 15 8
4 C 14 7
5 B 14 5
6 to 12 3
7 F 18 NA

Exemplo 2: organizar em várias colunas

Para organizar linhas em múltiplas colunas, podemos simplesmente fornecer mais nomes de colunas como argumentos:

 #sort by points, then assists
df %>% arrange(points, assists)

  player points assists
1 to 12 3
2 B 14 5
3 C 14 7
4 D 15 8
5 F 18 NA
6 E 20 14
7 G 29 9

Também podemos organizar as linhas por uma coluna ascendente e outra decrescente:

 #sort by points ascending, then assists descending
df %>% arrange(points, desc (assists))

  player points assists
1 to 12 3
2 C 14 7
3 B 14 5
4 D 15 8
5 F 18 NA
6 E 20 14
7 G 29 9

Exemplo 3: Organizar linhas em uma ordem personalizada

Às vezes, você também pode querer classificar as linhas em uma ordem personalizada. Você pode fazer isso facilmente usando um fator com níveis específicos:

 #sort by player with custom order
df %>% arrange( factor (player, levels = c('D', 'C', 'A', 'B', 'E', 'F', 'G')))

  player points assists
1 D 15 8
2 C 14 7
3 to 12 3
4 B 14 5
5 E 20 14
6 F 18 NA
7 G 29 9

Você pode encontrar a documentação completa da função organizar() aqui .

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *