Come eliminare le colonne per nome in r (con esempi)


Esistono tre modi comuni per rimuovere colonne da un frame di dati in R in base al nome:

Metodo 1: utilizzare Base R

 #drop col2 and col4 from data frame
df_new <- subset(df, select = -c(col2, col4))

Metodo 2: usa dplyr

 library (dplyr)

#drop col2 and col4 from data frame
df_new <- df %>% select(-c(col2, col4))

Metodo 3: utilizzare data.table

 library (data.table)

#convert data frame to data table
dt <- setDT(df)

#drop col2 and col4 from data frame
dt[, c(' col2 ', ' col4 '):=NULL]

I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con il seguente frame di dati in R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'C', 'D'),
                 points=c(12, 15, 22, 29, 35, 24, 11, 24),
                 rebounds=c(10, 4, 4, 15, 14, 9, 12, 8),
                 assists=c(7, 7, 5, 8, 19, 14, 11, 10))

#view data frame
df

  team points rebound assists
1 A 12 10 7
2 to 15 4 7
3 B 22 4 5
4 B 29 15 8
5 C 35 14 19
6 C 24 9 14
7 C 11 12 11
8 D 24 8 10

Esempio 1: rimuovere le colonne per nome utilizzando la base R

Il codice seguente mostra come rimuovere le colonne punto e helper dal frame di dati utilizzando la funzione subset() in base R:

 #create new data frame by dropping points and assists columns
df_new <- subset(df, select = -c(points, assists))

#view new data frame
df_new

  team rebounds
1 to 10
2 to 4
3 B 4
4 B 15
5 C 14
6 C 9
7 C 12
8 D 8

Tieni presente che le colonne dei punti e degli assist sono state entrambe rimosse dal nuovo frame dati.

Esempio 2: rimuovere le colonne per nome utilizzando dplyr

Il codice seguente mostra come rimuovere le colonne punto e helper dal frame di dati utilizzando la funzione select() dal pacchetto dplyr:

 library (dplyr)

#create new data frame by dropping points and assists columns
df_new <- df %>% select(-c(points, assists))

#view new data frame
df_new

  team rebounds
1 to 10
2 to 4
3 B 4
4 B 15
5 C 14
6 C 9
7 C 12
8 D 8

Tieni presente che le colonne dei punti e degli assist sono state entrambe rimosse dal nuovo frame dati.

Esempio 3: eliminare le colonne per nome utilizzando data.table

Il codice seguente mostra come rimuovere le colonne punto e helper dal frame di dati impostando entrambe le colonne su NULL utilizzando il pacchetto data.table:

 library (data.table)

#convert data frame to data table
dt <- setDT(df)

#drop points and assists columns
dt[, c(' points ', ' assists '):=NULL]

#view updated data table
dt

   team rebounds
1: At 10
2: A 4
3:B4
4:B15
5:C14
6: C 9
7:C12
8: D 8

Tieni presente che le colonne dei punti e degli assist sono state entrambe rimosse dalla nuova tabella dati.

Nota : tutti e tre i metodi producono lo stesso risultato, ma i metodi dplyr e data.table tenderanno ad essere più veloci quando si lavora con set di dati estremamente grandi.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in R:

Come rimuovere colonne con valori NA in R
Come riorganizzare le colonne in R
Come rinominare le colonne in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *