Come eliminare più colonne utilizzando dplyr (con esempi)


È possibile utilizzare uno dei seguenti metodi per rimuovere più colonne da un frame di dati in R utilizzando il pacchetto dplyr :

1. Rimuovi più colonne per nome

 df_new <- df %>% select(-c(col2, col4))

2. Rimuovere tutte le colonne dall’intervallo

 df_new <- df %>% select(-c(col2:col4))

I seguenti esempi mostrano come utilizzare nella pratica ciascuno di questi metodi con il seguente frame di dati:

 #create data frame
df = data. frame (rating = c(90, 85, 82, 88, 94, 90, 76, 75, 87, 86),
                points=c(25, 20, 14, 16, 27, 20, 12, 15, 14, 19),
                assists=c(5, 7, 7, 8, 5, 7, 6, 9, 9, 5),
                rebounds=c(11, 8, 10, 6, 6, 9, 6, 10, 10, 7))

#view data frame
df

   rating points assists rebounds
1 90 25 5 11
2 85 20 7 8
3 82 14 7 10
4 88 16 8 6
5 94 27 5 6
6 90 20 7 9
7 76 12 6 6
8 75 15 9 10
9 87 14 9 10
10 86 19 5 7

Esempio 1: rimuovere più colonne per nome

Il codice seguente mostra come rimuovere le colonne denominate punti e rimbalzi dal frame di dati:

 library (dplyr)

#drop points and rebounds columns
df_new <- df %>% select(-c(points, rebounds))

#view new data frame
new_df

   rating assists
1 90 5
2 85 7
3 82 7
4 88 8
5 94 5
6 90 7
7 76 6
8 75 9
9 87 9
10 86 5

Tieni presente che le colonne denominate punti e rimbalzi sono state entrambe rimosse dal nuovo frame di dati.

Esempio 2: rimuovi tutte le colonne dall’intervallo

Il codice seguente mostra come rimuovere tutte le colonne tra le colonne punti e rimbalzi :

 library (dplyr)

#drop all columns between points and rebounds
df_new <- df %>% select(-c(points:rebounds))

#view new data frame
new_df

   rating
1 90
2 85
3 82
4 88
5 94
6 90
7 76
8 75
9 87
10 86

Tieni presente che tutte le colonne tra punti e rimbalzi sono state rimosse dal nuovo frame di dati.

Nota : il pacchetto MASS in R ha anche una funzione select() . Se viene caricato anche questo pacchetto, è necessario utilizzare dplyr::select() in modo che R sappia come utilizzare la funzione select() del pacchetto dplyr .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre funzioni comuni in dplyr:

Come selezionare le colonne per indice utilizzando dplyr
Come rinominare più colonne utilizzando dplyr
Come sostituire una stringa in una colonna usando dplyr

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *