A: rimuovi le colonne se il nome contiene una stringa specifica


È possibile utilizzare i seguenti metodi per rimuovere colonne da un frame di dati in R il cui nome contiene stringhe specifiche:

Metodo 1: rimuovere le colonne se il nome contiene una stringa specifica

 library (dplyr)

df_new <- df %>% select(-contains(' this_string '))

Metodo 2: rimuovere le colonne se il nome contiene una delle numerose stringhe specifiche

 library (dplyr)

df_new <- df %>% select(-contains(c(' string1 ', ' string2 ', ' string3 ')))

I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con il seguente frame di dati in R:

 #create data frame
df <- data. frame (team_name=c('A', 'B', 'C', 'D', 'E', 'F'),
                 team_location=c('AU', 'AU', 'EU', 'EU', 'AU', 'EU'),
                 player_name=c('Andy', 'Bob', 'Chad', 'Dan', 'Ed', 'Fran'),
                 dots=c(22, 29, 35, 30, 18, 12))

#view data frame
df

  team_name team_location player_name points
1 A AU Andy 22
2 B AU Bob 29
3 C EU Chad 35
4 D EU Dan 30
5 E TO Ed 18
6 F EU Fran 12

Esempio 1: rimuovere le colonne se il nome contiene una stringa specifica

Possiamo utilizzare la seguente sintassi per rimuovere tutte le colonne dal frame di dati che contengono “team” in qualsiasi punto del nome della colonna:

 library (dplyr)

#drop columns that contain 'team'
df_new <- df %>% select(-contains(' team '))

#view new data frame
df_new

  player_name points
1 Andy 22
2 Bob 29
3 Chad 35
4 Dan 30
5 Ed 18
6 Fran 12

Da notare che le due colonne contenenti “team” nel nome sono state rimosse dal data frame.

Esempio 2: rimuovere le colonne se il nome contiene una delle numerose stringhe specifiche

Possiamo utilizzare la seguente sintassi per rimuovere tutte le colonne dal frame di dati che contengono “giocatore” o “punti” in qualsiasi punto del nome della colonna:

 #drop columns whose name contains 'player' or 'points'
df_new <- df %>% select(-contains(c(' player ', ' points ')))

#view new data frame
df

  team_name team_location
1 A AU
2 B AU
3 C EU
4 D EU
5 E AU
6 F EU

Da notare che le due colonne contenenti “giocatore” o “punti” nel nome sono state rimosse dal data frame.

Nota : puoi trovare la documentazione completa per la funzione dplyr select() qui .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in R:

Come eliminare le colonne per nome in R
Come preservare alcune colonne in R
Come rinominare le colonne del frame di dati in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *