Jak wybrać kolumny zawierające określony ciąg w r
Aby wybrać kolumny zawierające określony ciąg znaków, możesz użyć następujących funkcji z pakietu dplyr w R:
Metoda 1: Wybierz kolumny zawierające określony ciąg
df %>%
select(matches(" string1 "))
Metoda 2: Wybierz kolumny zawierające jeden z kilku ciągów
df %>%
select(matches(" string1|string2|string3 "))
Poniższe przykłady pokazują, jak w praktyce zastosować każdą z tych metod z następującą ramką danych w R:
#create data frame df <- data. frame (mavs=c(12, 10, 14, 19, 22, 25, 29), cavs=c(22, 41, 14, 15, 15, 19, 22), hornets=c(8, 8, 12, 14, 15, 13, 12), spurs=c(10, 12, 12, 16, 22, 28, 30), nets=c(9, 7, 10, 22, 28, 23, 25)) #view data frame df mavs cavs hornets spurs nets 1 12 22 8 10 9 2 10 41 8 12 7 3 14 14 12 12 10 4 19 15 14 16 22 5 22 15 15 22 28 6 25 19 13 28 23 7 29 22 12 30 25
Przykład 1: Wybierz kolumny zawierające określony ciąg
Poniższy kod pokazuje, jak używać funkcji match() do wybierania tylko kolumn zawierających w nazwie ciąg „avs”:
library (dplyr)
#select all columns that contain "avs" in the name
df %>%
select(matches(" avs "))
mavs cavs
1 12 22
2 10 41
3 14 14
4 19 15
5 22 15
6 25 19
7 29 22
Zwracane są tylko kolumny zawierające w nazwie „avs”.
W tym przypadku jedynymi zwracanymi kolumnami są „mavs” i „cavs”.
Przykład 2: Wybierz kolumny zawierające jeden z kilku ciągów
Poniższy kod pokazuje, jak używać funkcji match() do wybierania tylko kolumn zawierających w nazwie „avs” lub „ets”:
library (dplyr)
#select all columns that contain "avs" or "ets" in the name
df %>%
select(matches(" avs|ets "))
mavs cavs hornets nets
1 12 22 8 9
2 10 41 8 7
3 14 14 12 10
4 19 15 14 22
5 22 15 15 28
6 25 19 13 23
7 29 22 12 25
Zwracane są tylko kolumny zawierające w nazwie „avs” lub „ets”.
Zauważ, że pionowa kreska ( | ) to operator „ OR ” w R.
Możesz dowolnie łączyć dowolną liczbę operatorów „OR”, aby wybrać kolumny zawierające jeden z wielu różnych ciągów.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania za pomocą dplyr:
Jak wybrać kolumny według nazwy za pomocą dplyr
Jak wybrać kolumny według indeksu za pomocą dplyr
Jak używać funkcjiselect_if z wieloma warunkami w dplyr