Odp.: usuń kolumny, jeśli nazwa zawiera określony ciąg


Możesz użyć następujących metod, aby usunąć kolumny z ramki danych w R, której nazwa zawiera określone ciągi:

Metoda 1: Usuń kolumny, jeśli nazwa zawiera określony ciąg

 library (dplyr)

df_new <- df %>% select(-contains(' this_string '))

Metoda 2: Usuń kolumny, jeśli nazwa zawiera jeden z kilku określonych ciągów

 library (dplyr)

df_new <- df %>% select(-contains(c(' string1 ', ' string2 ', ' string3 ')))

Poniższe przykłady pokazują, jak w praktyce wykorzystać każdą metodę z następującą ramką danych w R:

 #create data frame
df <- data. frame (team_name=c('A', 'B', 'C', 'D', 'E', 'F'),
                 team_location=c('AU', 'AU', 'EU', 'EU', 'AU', 'EU'),
                 player_name=c('Andy', 'Bob', 'Chad', 'Dan', 'Ed', 'Fran'),
                 dots=c(22, 29, 35, 30, 18, 12))

#view data frame
df

  team_name team_location player_name points
1 A AU Andy 22
2 B AU Bob 29
3 C EU Chad 35
4 D EU Dan 30
5 E TO Ed 18
6 F EU Fran 12

Przykład 1: Usuń kolumny, jeśli nazwa zawiera określony ciąg

Możemy użyć następującej składni, aby usunąć wszystkie kolumny z ramki danych zawierające słowo „zespół” w dowolnym miejscu w nazwie kolumny:

 library (dplyr)

#drop columns that contain 'team'
df_new <- df %>% select(-contains(' team '))

#view new data frame
df_new

  player_name points
1 Andy 22
2 Bob 29
3 Chad 35
4 Dan 30
5 Ed 18
6 Fran 12

Należy zauważyć, że dwie kolumny zawierające w nazwie słowo „zespół” zostały usunięte z ramki danych.

Przykład 2: Usuń kolumny, jeśli nazwa zawiera jeden z kilku określonych ciągów

Możemy użyć poniższej składni, aby usunąć z ramki danych wszystkie kolumny zawierające słowo „gracz” lub „punkty” w dowolnym miejscu nazwy kolumny:

 #drop columns whose name contains 'player' or 'points'
df_new <- df %>% select(-contains(c(' player ', ' points ')))

#view new data frame
df

  team_name team_location
1 A AU
2 B AU
3 C EU
4 D EU
5 E AU
6 F EU

Należy zauważyć, że dwie kolumny zawierające w nazwie słowo „gracz” lub „punkty” zostały usunięte z ramki danych.

Uwaga : pełną dokumentację funkcji dplyrselect() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak usunąć kolumny według nazwy w R
Jak zachować niektóre kolumny w R
Jak zmienić nazwę kolumn ramki danych w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *