Hoe lijnen in r te rangschikken
Vaak wilt u de rijen van een dataframe in R in een specifieke volgorde rangschikken. Gelukkig is dit eenvoudig te doen met behulp van de functie arrange() uit de dplyr- bibliotheek.
In deze tutorial worden verschillende voorbeelden van praktisch gebruik van deze functie uitgelegd met behulp van het volgende dataframe:
#create data frame df <- data.frame(player = c('A', 'B', 'C', 'D', 'E', 'F', 'G'), points = c(12, 14, 14, 15, 20, 18, 29), assists = c(3, 5, 7, 8, 14, NA, 9)) #view data frame df player points assists 1 to 12 3 2 B 14 5 3 C 14 7 4 D 15 8 5 E 20 14 6 F 18 NA 7 G 29 9
Voorbeeld 1: Organiseren op basis van een kolom
De volgende code laat zien hoe u het dataframe in oplopende volgorde kunt rangschikken op basis van de waarden in de kolom ‚punten‘:
library(dplyr) df %>% arrange(points) player points assists 1 to 12 3 2 B 14 5 3 C 14 7 4 D 15 8 5 F 18 NA 6 E 20 14 7 G 29 9
Om in aflopende volgorde te sorteren, kunt u de functie desc() gebruiken:
df %>% arrange( desc (dots))
player points assists
1 G 29 9
2 E 20 14
3 F 18 NA
4 D 15 8
5 B 14 5
6 C 14 5
7 to 12 3
Houd er rekening mee dat de NA’s tot het einde worden gesorteerd, ongeacht of u wel of niet in oplopende of aflopende volgorde sorteert:
df %>% arrange(assists)
player points assists
1 to 12 3
2 B 14 5
3 C 14 7
4 D 15 8
5 G 29 9
6 E 20 14
7 F 18 NA
df %>% arrange( desc (assists))
player points assists
1 E 20 14
2 G 29 9
3 D 15 8
4 C 14 7
5 B 14 5
6 to 12 3
7 F 18 NA
Voorbeeld 2: Schik over meerdere kolommen
Om rijen over meerdere kolommen te rangschikken, kunnen we eenvoudigweg meer kolomnamen als argumenten opgeven:
#sort by points, then assists
df %>% arrange(points, assists)
player points assists
1 to 12 3
2 B 14 5
3 C 14 7
4 D 15 8
5 F 18 NA
6 E 20 14
7 G 29 9
We kunnen de rijen ook ordenen in een oplopende kolom en een andere aflopende kolom:
#sort by points ascending, then assists descending df %>% arrange(points, desc (assists)) player points assists 1 to 12 3 2 C 14 7 3 B 14 5 4 D 15 8 5 F 18 NA 6 E 20 14 7 G 29 9
Voorbeeld 3: Rangschik rijen in een aangepaste volgorde
Soms wilt u de rijen misschien ook in een aangepaste volgorde sorteren. U kunt dit eenvoudig doen met behulp van een factor met specifieke niveaus:
#sort by player with custom order df %>% arrange( factor (player, levels = c('D', 'C', 'A', 'B', 'E', 'F', 'G'))) player points assists 1 D 15 8 2 C 14 7 3 to 12 3 4 B 14 5 5 E 20 14 6 F 18 NA 7 G 29 9
U kunt de volledige documentatie voor de functie arrange() hier vinden.