Hoe lijnen in r te rangschikken


Vaak wilt u de rijen van een dataframe in R in een specifieke volgorde rangschikken. Gelukkig is dit eenvoudig te doen met behulp van de functie arrange() uit de dplyr- bibliotheek.

In deze tutorial worden verschillende voorbeelden van praktisch gebruik van deze functie uitgelegd met behulp van het volgende dataframe:

 #create data frame
df <- data.frame(player = c('A', 'B', 'C', 'D', 'E', 'F', 'G'),
                 points = c(12, 14, 14, 15, 20, 18, 29),
                 assists = c(3, 5, 7, 8, 14, NA, 9))

#view data frame 
df

  player points assists
1 to 12 3
2 B 14 5
3 C 14 7
4 D 15 8
5 E 20 14
6 F 18 NA
7 G 29 9

Voorbeeld 1: Organiseren op basis van een kolom

De volgende code laat zien hoe u het dataframe in oplopende volgorde kunt rangschikken op basis van de waarden in de kolom ‚punten‘:

 library(dplyr)

df %>% arrange(points)

  player points assists
1 to 12 3
2 B 14 5
3 C 14 7
4 D 15 8
5 F 18 NA
6 E 20 14
7 G 29 9

Om in aflopende volgorde te sorteren, kunt u de functie desc() gebruiken:

 df %>% arrange( desc (dots))

  player points assists
1 G 29 9
2 E 20 14
3 F 18 NA
4 D 15 8
5 B 14 5
6 C 14 5
7 to 12 3

Houd er rekening mee dat de NA’s tot het einde worden gesorteerd, ongeacht of u wel of niet in oplopende of aflopende volgorde sorteert:

 df %>% arrange(assists)

  player points assists
1 to 12 3
2 B 14 5
3 C 14 7
4 D 15 8
5 G 29 9
6 E 20 14
7 F 18 NA

df %>% arrange( desc (assists))

  player points assists
1 E 20 14
2 G 29 9
3 D 15 8
4 C 14 7
5 B 14 5
6 to 12 3
7 F 18 NA

Voorbeeld 2: Schik over meerdere kolommen

Om rijen over meerdere kolommen te rangschikken, kunnen we eenvoudigweg meer kolomnamen als argumenten opgeven:

 #sort by points, then assists
df %>% arrange(points, assists)

  player points assists
1 to 12 3
2 B 14 5
3 C 14 7
4 D 15 8
5 F 18 NA
6 E 20 14
7 G 29 9

We kunnen de rijen ook ordenen in een oplopende kolom en een andere aflopende kolom:

 #sort by points ascending, then assists descending
df %>% arrange(points, desc (assists))

  player points assists
1 to 12 3
2 C 14 7
3 B 14 5
4 D 15 8
5 F 18 NA
6 E 20 14
7 G 29 9

Voorbeeld 3: Rangschik rijen in een aangepaste volgorde

Soms wilt u de rijen misschien ook in een aangepaste volgorde sorteren. U kunt dit eenvoudig doen met behulp van een factor met specifieke niveaus:

 #sort by player with custom order
df %>% arrange( factor (player, levels = c('D', 'C', 'A', 'B', 'E', 'F', 'G')))

  player points assists
1 D 15 8
2 C 14 7
3 to 12 3
4 B 14 5
5 E 20 14
6 F 18 NA
7 G 29 9

U kunt de volledige documentatie voor de functie arrange() hier vinden.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert