Hoe de dplyr-transmutefunctie in r te gebruiken (met voorbeelden)
U kunt de functie transmute() in R gebruiken om nieuwe berekende variabelen aan een dataframe toe te voegen en bestaande variabelen te verwijderen.
Deze functie gebruikt de volgende basissyntaxis:
df %>% transmute(var_new = var1 * 2)
In dit voorbeeld wordt een nieuwe variabele met de naam var_new gemaakt door een bestaande variabele met de naam var1 met 2 te vermenigvuldigen.
De volgende voorbeelden laten zien hoe u de functie transmute() gebruikt met het volgende dataframe in R:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
points=c(99, 90, 86, 88, 95),
assists=c(33, 28, 31, 39, 34),
rebounds=c(30, 28, 24, 24, 28))
#view data frame
df
team points assists rebounds
1 A 99 33 30
2 B 90 28 28
3 C 86 31 24
4 D 88 39 24
5 E 95 34 28
Voorbeeld 1: Gebruik transmute() om een nieuwe variabele te maken
De volgende code laat zien hoe u transmute() gebruikt om een nieuwe variabele te maken:
library (dplyr)
#create new variable called points2
df %>% transmute(points2 = points * 2)
points2
1,198
2,180
3,172
4,176
5,190
Punt2- waarden zijn gelijk aan de oorspronkelijke waarden van de puntkolom vermenigvuldigd met twee.
Merk op dat de functie transmute() het originele dataframe niet daadwerkelijk wijzigt.
Om de resultaten van de functie transmute() in een nieuw dataframe op te slaan, moet u ze in een variabele opslaan:
library (dplyr)
#store results of transmute in variable
df_points2 <- df %>% transmute(points2 = points * 2)
#view results
df_points2
points2
1,198
2,180
3,172
4,176
5,190
De resultaten van transmute() worden nu opgeslagen in een nieuw dataframe.
Voorbeeld 2: Gebruik transmute() om meerdere nieuwe variabelen te maken
De volgende code laat zien hoe u transmute() kunt gebruiken om meerdere nieuwe variabelen te maken op basis van bestaande variabelen:
library (dplyr)
#create multiple new variables
df %>%
transmute(
points2 = points * 2,
rebounds_squared = rebounds^2,
assists_half = assists/2,
team_name= paste0(' team_ ', team)
)
points2 rebounds_squared assists_half team_name
1,198,900 16.5 team_A
2 180 784 14.0 team_B
3 172 576 15.5 team_C
4 176 576 19.5 team_D
5 190 784 17.0 team_E
Merk op dat er vier nieuwe variabelen zijn gemaakt.
Aanvullende bronnen
In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in R uitvoert:
Hoe de functie move() in dplyr te gebruiken
Hoe de slice()-functie in dplyr te gebruiken
Hoe te filteren op regelnummer in dplyr