Jak wybrać kolumny, które nie zaczynają się od ciągu znaków w dplyr
Możesz użyć następujących funkcji z pakietu dplyr w R, aby wybrać kolumny, które nie zaczynają się od określonego ciągu:
Metoda 1: Wybierz kolumny, które nie zaczynają się od określonego ciągu
df %>%
select(-starts_with(" string1 "))
Metoda 2: Wybierz kolumny, które nie zaczynają się od jednego z wielu ciągów
df %>% select(-starts_with(c(" string1 ", " string2 ", " string3 ")))
Poniższe przykłady pokazują, jak w praktyce zastosować każdą z tych metod z następującą ramką danych w R:
#create data frame df <- data. frame (store1_sales=c(12, 10, 14, 19, 22, 25, 29), store1_returns=c(3, 3, 2, 4, 3, 2, 1), store2_sales=c(8, 8, 12, 14, 15, 13, 12), store2_returns=c(1, 2, 2, 1, 2, 1, 3), promotions=c(0, 1, 1, 1, 0, 0, 1)) #view data frame df store1_sales store1_returns store2_sales store2_returns promotions 1 12 3 8 1 0 2 10 3 8 2 1 3 14 2 12 2 1 4 19 4 14 1 1 5 22 3 15 2 0 6 25 2 13 1 0 7 29 1 12 3 1
Przykład 1: Wybierz kolumny, które nie zaczynają się od określonego ciągu
Poniższy kod pokazuje, jak używać funkcji -starts_with() do wybierania tylko kolumn, które w ramce danych nie zaczynają się od „store1”:
library (dplyr)
#select all columns that do not start with "store1"
df %>%
select(-starts_with(" store1 "))
store2_sales store2_returns promotions
1 8 1 0
2 8 2 1
3 12 2 1
4 14 1 1
5 15 2 0
6 13 1 0
7 12 3 1
Należy pamiętać, że dwie kolumny zaczynające się od „store1” nie są zwracane.
Przykład 2: Wybierz kolumny, które nie zaczynają się od jednego z kilku ciągów
Poniższy kod pokazuje, jak używać funkcji -starts_with() do wybierania tylko kolumn, które w ramce danych nie zaczynają się od „store1” ani „prom”:
library (dplyr)
#select all columns that do not start with "store1" or "prom"
df %>%
select(-starts_with(c(" store1 ", " prom ")))
store2_sales store2_returns
1 8 1
2 8 2
3 12 2
4 14 1
5 15 2
6 13 1
7 12 3
Należy pamiętać, że kolumny zaczynające się od „store1” lub „prom” nie są zwracane.
Uwaga : Domyślnie funkcja start_with() nie uwzględnia wielkości liter. Aby funkcja uwzględniała wielkość liter, użyj w niej argumentu ignorowania.case=FALSE .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania za pomocą dplyr:
Jak wybrać kolumny według nazwy za pomocą dplyr
Jak wybrać kolumny według indeksu za pomocą dplyr
Jak używać funkcjiselect_if z wieloma warunkami w dplyr