Come selezionare colonne specifiche in r: con esempi


È possibile utilizzare la seguente sintassi per selezionare colonne specifiche in un frame di dati basato su R:

 #select columns by name
df[c(' col1 ', ' col2 ', ' col4 ')]

#select columns by index
df[c(1, 2, 4)]

In alternativa, puoi utilizzare la funzione select() dal pacchetto dplyr :

 library (dplyr)

#select columns by name
df %>%
  select(col1, col2, col4)

#select columns by index
df %>%
  select(1, 2, 4)

Per set di dati estremamente grandi, si consiglia di utilizzare il metodo dplyr perché la funzione select() tende ad essere più veloce delle funzioni R di base.

I seguenti esempi mostrano come utilizzare questi due metodi nella pratica con il seguente frame di dati:

 #create data frame
df <- data. frame (a=c(1, 3, 4, 6, 8, 9),
                 b=c(7, 8, 8, 7, 13, 16),
                 c=c(11, 13, 13, 18, 19, 22),
                 d=c(12, 16, 18, 22, 29, 38))

#view data frame
df

  abcd
1 1 7 11 12
2 3 8 13 16
3 4 8 13 18
4 6 7 18 22
5 8 13 19 29
6 9 16 22 38

Esempio 1: seleziona colonne specifiche utilizzando Base R (per nome)

Il codice seguente mostra come selezionare colonne specifiche per nome utilizzando la base R:

 #select columns by name
df[c(' a ', ' b ', ' d ')]

  abd
1 1 7 12
2 3 8 16
3 4 8 18
4 6 7 22
5 8 13 29
6 9 16 38

Esempio 2: selezionare colonne specifiche utilizzando R base (per indice)

Il codice seguente mostra come selezionare colonne specifiche per indice utilizzando la base R:

 #select columns by index
df[c(1, 2, 4)]

  abd
1 1 7 12
2 3 8 16
3 4 8 18
4 6 7 22
5 8 13 29
6 9 16 38

Esempio 3: seleziona colonne specifiche utilizzando dplyr (per nome)

Il codice seguente mostra come selezionare colonne specifiche per nome utilizzando dplyr:

 library (dplyr)

#select columns by name
df %>%
  select(a, b, d)

  abd
1 1 7 12
2 3 8 16
3 4 8 18
4 6 7 22
5 8 13 29
6 9 16 38

Esempio 4: seleziona colonne specifiche utilizzando dplyr (per indice)

Il codice seguente mostra come selezionare colonne specifiche per indice utilizzando dplyr:

 library (dplyr)

#select columns by index
df %>%
  select(1, 2, 4)

  abd
1 1 7 12
2 3 8 16
3 4 8 18
4 6 7 22
5 8 13 29
6 9 16 38

Risorse addizionali

Come aggiungere una colonna a un frame di dati in R
Come scorrere i nomi delle colonne in R
Come ordinare un frame di dati per colonna in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *