Come selezionare le colonne per nome usando dplyr


È possibile utilizzare i seguenti metodi per selezionare le colonne di un frame di dati per nome in R utilizzando il pacchetto dplyr :

Metodo 1: seleziona colonne specifiche per nome

 df %>% select(var1, var3)

Metodo 2: selezionare un intervallo di colonne in base al nome

 df %>% select(var1:var3)

Metodo 3: seleziona tutte le colonne tranne alcune colonne

 df %>% select(-c(var1, var3))

I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con il seguente frame di dati in R:

 #create data frame
df <- data. frame (points=c(1, 5, 4, 5, 5, 7, 8),
                 rebounds=c(10, 3, 3, 2, 6, 7, 12),
                 assists=c(5, 5, 7, 6, 7, 9, 15),
                 blocks=c(1, 1, 0, 4, 3, 2, 10))

#view data frame
df

  points rebounds assists blocks
1 1 10 5 1
2 5 3 5 1
3 4 3 7 0
4 5 2 6 4
5 5 6 7 3
6 7 7 9 2
7 8 12 15 10

Esempio 1: seleziona colonne specifiche per nome

Possiamo utilizzare il seguente codice per selezionare solo le colonne punti e assist :

 library (dplyr)

#select only points and assists columns
df %>% select(points, assists)

  assist points
1 1 5
2 5 5
3 4 7
4 5 6
5 5 7
6 7 9
7 8 15

Tieni presente che vengono restituite solo le colonne dei punti e degli assist .

Esempio 2: selezionare un intervallo di colonne in base al nome

Possiamo utilizzare il seguente codice per selezionare tutte le colonne tra i nomi dei punti e degli assist .

 library (dplyr)

#select all columns between points and assists
df %>% select(points:assists)

  points rebound assists
1 1 10 5
2 5 3 5
3 4 3 7
4 5 2 6
5 5 6 7
6 7 7 9
7 8 12 15

Viene restituito un intervallo di colonne, che inizia con la colonna dei punti e termina con la colonna degli assist .

Esempio 3: seleziona tutte le colonne tranne alcune colonne

Possiamo utilizzare il seguente codice per selezionare tutte le colonne tranne le colonne punti e assist .

 library (dplyr)

#select all columns except points and assists columns
df %>% select(-c(points, assists))

  rebound blocks
1 10 1
2 3 1
3 3 0
4 2 4
5 6 3
6 7 2
7 12 10

Vengono restituite tutte le colonne tranne quelle dei punti e degli assist .

Nota : puoi trovare la documentazione completa della funzione di selezione in dplyr qui .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni in dplyr:

Come selezionare le colonne per indice utilizzando dplyr
Come selezionare la prima riga per gruppo utilizzando dplyr

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *