Como organizar linhas em r
Freqüentemente, você pode querer organizar as linhas de um quadro de dados em R em uma ordem específica. Felizmente, isso é fácil de fazer usando a função organize() da biblioteca dplyr .
Este tutorial explica vários exemplos de uso prático desta função usando o seguinte data frame:
#create data frame df <- data.frame(player = c('A', 'B', 'C', 'D', 'E', 'F', 'G'), points = c(12, 14, 14, 15, 20, 18, 29), assists = c(3, 5, 7, 8, 14, NA, 9)) #view data frame df player points assists 1 to 12 3 2 B 14 5 3 C 14 7 4 D 15 8 5 E 20 14 6 F 18 NA 7 G 29 9
Exemplo 1: Organizar por coluna
O código a seguir mostra como organizar o quadro de dados em ordem crescente com base nos valores da coluna “pontos”:
library(dplyr) df %>% arrange(points) player points assists 1 to 12 3 2 B 14 5 3 C 14 7 4 D 15 8 5 F 18 NA 6 E 20 14 7 G 29 9
Para classificar em ordem decrescente, você pode usar a função desc() :
df %>% arrange( desc (dots))
player points assists
1 G 29 9
2 E 20 14
3 F 18 NA
4 D 15 8
5 B 14 5
6 C 14 5
7 to 12 3
Observe que os NAs serão classificados até o final, independentemente de você classificar ou não em ordem crescente ou decrescente:
df %>% arrange(assists)
player points assists
1 to 12 3
2 B 14 5
3 C 14 7
4 D 15 8
5 G 29 9
6 E 20 14
7 F 18 NA
df %>% arrange( desc (assists))
player points assists
1 E 20 14
2 G 29 9
3 D 15 8
4 C 14 7
5 B 14 5
6 to 12 3
7 F 18 NA
Exemplo 2: organizar em várias colunas
Para organizar linhas em múltiplas colunas, podemos simplesmente fornecer mais nomes de colunas como argumentos:
#sort by points, then assists
df %>% arrange(points, assists)
player points assists
1 to 12 3
2 B 14 5
3 C 14 7
4 D 15 8
5 F 18 NA
6 E 20 14
7 G 29 9
Também podemos organizar as linhas por uma coluna ascendente e outra decrescente:
#sort by points ascending, then assists descending df %>% arrange(points, desc (assists)) player points assists 1 to 12 3 2 C 14 7 3 B 14 5 4 D 15 8 5 F 18 NA 6 E 20 14 7 G 29 9
Exemplo 3: Organizar linhas em uma ordem personalizada
Às vezes, você também pode querer classificar as linhas em uma ordem personalizada. Você pode fazer isso facilmente usando um fator com níveis específicos:
#sort by player with custom order df %>% arrange( factor (player, levels = c('D', 'C', 'A', 'B', 'E', 'F', 'G'))) player points assists 1 D 15 8 2 C 14 7 3 to 12 3 4 B 14 5 5 E 20 14 6 F 18 NA 7 G 29 9
Você pode encontrar a documentação completa da função organizar() aqui .