Jak korzystać z funkcji transmute dplyr w r (z przykładami)


Możesz użyć funkcji transmute() w R, aby dodać nowe zmienne obliczone do ramki danych i usunąć wszelkie istniejące zmienne.

Ta funkcja wykorzystuje następującą podstawową składnię:

 df %>% transmute(var_new = var1 * 2)

W tym przykładzie nowa zmienna o nazwie var_new zostanie utworzona poprzez pomnożenie istniejącej zmiennej o nazwie var1 przez 2.

Poniższe przykłady pokazują, jak używać funkcji transmute() z następującą ramką danych w R:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#view data frame
df

  team points assists rebounds
1 A 99 33 30
2 B 90 28 28
3 C 86 31 24
4 D 88 39 24
5 E 95 34 28

Przykład 1: Użyj transmute(), aby utworzyć nową zmienną

Poniższy kod pokazuje, jak użyć transmute() do utworzenia nowej zmiennej:

 library (dplyr)

#create new variable called points2
df %>% transmute(points2 = points * 2)

  points2
1,198
2,180
3,172
4,176
5,190

Wartości Point2 są równe pierwotnym wartościom kolumny punktowej pomnożonym przez dwa.

Należy zauważyć, że funkcja transmute() w rzeczywistości nie modyfikuje oryginalnej ramki danych.

Aby zapisać wyniki funkcji transmute() w nowej ramce danych, musisz zapisać je w zmiennej:

 library (dplyr)

#store results of transmute in variable
df_points2 <- df %>% transmute(points2 = points * 2)

#view results
df_points2

  points2
1,198
2,180
3,172
4,176
5,190

Wyniki transmute() są teraz przechowywane w nowej ramce danych.

Przykład 2: Użyj transmute(), aby utworzyć wiele nowych zmiennych

Poniższy kod pokazuje, jak używać transmute() do tworzenia wielu nowych zmiennych na podstawie istniejących zmiennych:

 library (dplyr)

#create multiple new variables
df %>%
 transmute(
  points2 = points * 2,
  rebounds_squared = rebounds^2,
  assists_half = assists/2,
  team_name= paste0(' team_ ', team)
)

  points2 rebounds_squared assists_half team_name
1,198,900 16.5 team_A
2 180 784 14.0 team_B
3 172 576 15.5 team_C
4 176 576 19.5 team_D
5 190 784 17.0 team_E

Należy zauważyć, że utworzono cztery nowe zmienne.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje w języku R:

Jak korzystać z funkcji relocate() w dplyr
Jak korzystać z funkcji plasterka() w dplyr
Jak filtrować według numeru linii w dplyr

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *