Come eliminare le colonne per nome in r (con esempi)
Esistono tre modi comuni per rimuovere colonne da un frame di dati in R in base al nome:
Metodo 1: utilizzare Base R
#drop col2 and col4 from data frame
df_new <- subset(df, select = -c(col2, col4))
Metodo 2: usa dplyr
library (dplyr) #drop col2 and col4 from data frame df_new <- df %>% select(-c(col2, col4))
Metodo 3: utilizzare data.table
library (data.table) #convert data frame to data table dt <- setDT(df) #drop col2 and col4 from data frame dt[, c(' col2 ', ' col4 '):=NULL]
I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con il seguente frame di dati in R:
#create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'C', 'D'),
points=c(12, 15, 22, 29, 35, 24, 11, 24),
rebounds=c(10, 4, 4, 15, 14, 9, 12, 8),
assists=c(7, 7, 5, 8, 19, 14, 11, 10))
#view data frame
df
team points rebound assists
1 A 12 10 7
2 to 15 4 7
3 B 22 4 5
4 B 29 15 8
5 C 35 14 19
6 C 24 9 14
7 C 11 12 11
8 D 24 8 10
Esempio 1: rimuovere le colonne per nome utilizzando la base R
Il codice seguente mostra come rimuovere le colonne punto e helper dal frame di dati utilizzando la funzione subset() in base R:
#create new data frame by dropping points and assists columns
df_new <- subset(df, select = -c(points, assists))
#view new data frame
df_new
team rebounds
1 to 10
2 to 4
3 B 4
4 B 15
5 C 14
6 C 9
7 C 12
8 D 8
Tieni presente che le colonne dei punti e degli assist sono state entrambe rimosse dal nuovo frame dati.
Esempio 2: rimuovere le colonne per nome utilizzando dplyr
Il codice seguente mostra come rimuovere le colonne punto e helper dal frame di dati utilizzando la funzione select() dal pacchetto dplyr:
library (dplyr)
#create new data frame by dropping points and assists columns
df_new <- df %>% select(-c(points, assists))
#view new data frame
df_new
team rebounds
1 to 10
2 to 4
3 B 4
4 B 15
5 C 14
6 C 9
7 C 12
8 D 8
Tieni presente che le colonne dei punti e degli assist sono state entrambe rimosse dal nuovo frame dati.
Esempio 3: eliminare le colonne per nome utilizzando data.table
Il codice seguente mostra come rimuovere le colonne punto e helper dal frame di dati impostando entrambe le colonne su NULL utilizzando il pacchetto data.table:
library (data.table)
#convert data frame to data table
dt <- setDT(df)
#drop points and assists columns
dt[, c(' points ', ' assists '):=NULL]
#view updated data table
dt
team rebounds
1: At 10
2: A 4
3:B4
4:B15
5:C14
6: C 9
7:C12
8: D 8
Tieni presente che le colonne dei punti e degli assist sono state entrambe rimosse dalla nuova tabella dati.
Nota : tutti e tre i metodi producono lo stesso risultato, ma i metodi dplyr e data.table tenderanno ad essere più veloci quando si lavora con set di dati estremamente grandi.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in R:
Come rimuovere colonne con valori NA in R
Come riorganizzare le colonne in R
Come rinominare le colonne in R