Hoe de unite-functie in r te gebruiken (met voorbeelden)
De unit()- functie van het Tidyr- pakket kan worden gebruikt om meerdere dataframekolommen in één enkele kolom te verenigen.
Deze functie gebruikt de volgende basissyntaxis:
eenheid(gegevens, col, in, sep)
Goud:
- data : Naam van het dataframe
- col : naam van de nieuwe gewone kolom
- … : Vector met namen voor de kolommen die moeten worden samengevoegd
- sep : gegevens samenvoegen in een nieuwe verenigde kolom
De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.
Voorbeeld 1: verenig twee kolommen tot één enkele kolom
Stel dat we het volgende dataframe in R hebben:
#create data frame df <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'), year=c(1, 2, 1, 2, 1, 2), dots=c(22, 29, 18, 11, 12, 19), assists=c(2, 3, 6, 8, 5, 2)) #view data frame df player year points assists 1 A 1 22 2 2 A 2 29 3 3 B 1 18 6 4 B 2 11 8 5 C 1 12 5 6 C 2 19 2
We kunnen de functie unit() gebruiken om de kolommen “punten” en “hulp” te combineren in één enkele kolom:
library (tidyr) #unite points and assists columns into single column unit(df, col=' points-assists ', c(' points ', ' assists '), sep=' - ') player year points assists 1 A 1 22-2 2 A 2 29-3 3 B 1 18-6 4 B 2 11-8 5 C 1 12-5 6 C 2 19-2
Voorbeeld 2: meer dan twee kolommen samenvoegen
Stel dat we het volgende dataframe in R hebben:
#create data frame df2 <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'), year=c(1, 2, 1, 2, 1, 2), dots=c(22, 29, 18, 11, 12, 19), assists=c(2, 3, 6, 8, 5, 2), blocks=c(2, 3, 3, 2, 1, 0)) #view data frame df2 player year points assists blocks 1 A 1 22 2 2 2 A 2 29 3 3 3 B 1 18 6 3 4 B 2 11 8 2 5 C 1 12 5 1 6 C 2 19 2 0
We kunnen de functie unit() gebruiken om de punten-, assist- en blokkeerkolommen in één enkele kolom te verenigen:
library (tidyr) #unite points, assists, and blocks column into single column unit(df2, col=' stats ', c(' points ', ' assists ', ' blocks '), sep=' / ') player year stats 1 A 1 22/2/2 2 to 2 3/29/3 3 B 1 18/6/3 4 B 2 11/8/2 5 C 1 12/5/1 6 C 2 19/2/0
Aanvullende bronnen
Het doel van het Tidyr- pakket is om “opgeruimde” data te creëren, die de volgende kenmerken heeft:
- Elke kolom is een variabele.
- Elke lijn is een observatie.
- Elke cel is een unieke waarde.
Het Tidyr-pakket gebruikt vier hoofdfuncties om geordende gegevens te creëren:
1. De spread() -functie.
2. De functie verzamelen() .
3. De functie afzonderlijke() .
4. De unit() -functie.
Als u deze vier functies onder de knie heeft, kunt u uit elk dataframe ‘nette’ data creëren.