So verwenden sie die dplyr-transmute-funktion in r (mit beispielen)
Sie können die Funktion transmute() in R verwenden, um einem Datenrahmen neue berechnete Variablen hinzuzufügen und alle vorhandenen Variablen zu entfernen.
Diese Funktion verwendet die folgende grundlegende Syntax:
df %>% transmute(var_new = var1 * 2)
In diesem Beispiel wird eine neue Variable namens var_new erstellt, indem eine vorhandene Variable namens var1 mit 2 multipliziert wird.
Die folgenden Beispiele zeigen, wie die Funktion transmute() mit dem folgenden Datenrahmen in R verwendet wird:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
points=c(99, 90, 86, 88, 95),
assists=c(33, 28, 31, 39, 34),
rebounds=c(30, 28, 24, 24, 28))
#view data frame
df
team points assists rebounds
1 A 99 33 30
2 B 90 28 28
3 C 86 31 24
4 D 88 39 24
5 E 95 34 28
Beispiel 1: Verwenden Sie transmute(), um eine neue Variable zu erstellen
Der folgende Code zeigt, wie man mit transmute() eine neue Variable erstellt:
library (dplyr)
#create new variable called points2
df %>% transmute(points2 = points * 2)
points2
1,198
2,180
3,172
4,176
5,190
Point2- Werte entsprechen den ursprünglichen Werten der Punktspalte multipliziert mit zwei.
Beachten Sie, dass die Funktion transmute() den ursprünglichen Datenrahmen nicht wirklich ändert.
Um die Ergebnisse der Funktion transmute() in einem neuen Datenrahmen zu speichern, müssen Sie sie in einer Variablen speichern:
library (dplyr)
#store results of transmute in variable
df_points2 <- df %>% transmute(points2 = points * 2)
#view results
df_points2
points2
1,198
2,180
3,172
4,176
5,190
Die Ergebnisse von transmute() werden nun in einem neuen Datenrahmen gespeichert.
Beispiel 2: Verwenden Sie transmute(), um mehrere neue Variablen zu erstellen
Der folgende Code zeigt, wie Sie mit transmute() mehrere neue Variablen aus vorhandenen Variablen erstellen:
library (dplyr)
#create multiple new variables
df %>%
transmute(
points2 = points * 2,
rebounds_squared = rebounds^2,
assists_half = assists/2,
team_name= paste0(' team_ ', team)
)
points2 rebounds_squared assists_half team_name
1,198,900 16.5 team_A
2 180 784 14.0 team_B
3 172 576 15.5 team_C
4 176 576 19.5 team_D
5 190 784 17.0 team_E
Beachten Sie, dass vier neue Variablen erstellt wurden.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie andere gängige Vorgänge in R ausgeführt werden:
So verwenden Sie die Funktion relocate() in dplyr
So verwenden Sie die Funktion „slice()“ in dplyr
So filtern Sie nach Zeilennummer in dplyr