Як видалити стовпці за назвою в r (з прикладами)


Існує три поширених способи видалення стовпців із кадру даних у R за назвою:

Спосіб 1: Використовуйте Base R

 #drop col2 and col4 from data frame
df_new <- subset(df, select = -c(col2, col4))

Спосіб 2: використовуйте dplyr

 library (dplyr)

#drop col2 and col4 from data frame
df_new <- df %>% select(-c(col2, col4))

Спосіб 3: Використовуйте data.table

 library (data.table)

#convert data frame to data table
dt <- setDT(df)

#drop col2 and col4 from data frame
dt[, c(' col2 ', ' col4 '):=NULL]

У наведених нижче прикладах показано, як використовувати кожен метод на практиці з таким кадром даних у R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'C', 'D'),
                 points=c(12, 15, 22, 29, 35, 24, 11, 24),
                 rebounds=c(10, 4, 4, 15, 14, 9, 12, 8),
                 assists=c(7, 7, 5, 8, 19, 14, 11, 10))

#view data frame
df

  team points rebound assists
1 A 12 10 7
2 to 15 4 7
3 B 22 4 5
4 B 29 15 8
5 C 35 14 19
6 C 24 9 14
7 C 11 12 11
8 D 24 8 10

Приклад 1: Видалення стовпців за назвою за допомогою бази R

Наступний код показує, як видалити точкові та допоміжні стовпці з кадру даних за допомогою функції subset() у базовому R:

 #create new data frame by dropping points and assists columns
df_new <- subset(df, select = -c(points, assists))

#view new data frame
df_new

  team rebounds
1 to 10
2 to 4
3 B 4
4 B 15
5 C 14
6 C 9
7 C 12
8 D 8

Зауважте, що стовпці очок і передач видалено з нового кадру даних.

Приклад 2: видаліть стовпці за назвою за допомогою dplyr

Наступний код показує, як видалити точкові та допоміжні стовпці з кадру даних за допомогою функції select() із пакета dplyr:

 library (dplyr)

#create new data frame by dropping points and assists columns
df_new <- df %>% select(-c(points, assists))

#view new data frame
df_new

  team rebounds
1 to 10
2 to 4
3 B 4
4 B 15
5 C 14
6 C 9
7 C 12
8 D 8

Зауважте, що стовпці очок і передач видалено з нового кадру даних.

Приклад 3: видаліть стовпці за назвою за допомогою data.table

У наведеному нижче коді показано, як видалити стовпці точки та допоміжні стовпці з кадру даних, установивши для обох стовпців значення NULL за допомогою пакета data.table:

 library (data.table)

#convert data frame to data table
dt <- setDT(df)

#drop points and assists columns
dt[, c(' points ', ' assists '):=NULL]

#view updated data table
dt

   team rebounds
1: At 10
2: A 4
3:B4
4:B15
5:C14
6: C 9
7:C12
8: D 8

Зверніть увагу, що обидва стовпці очок і передач видалено з нової таблиці даних.

Примітка : усі три методи дають однаковий результат, але методи dplyr і data.table , як правило, будуть швидшими під час роботи з надзвичайно великими наборами даних.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в R:

Як видалити стовпці зі значеннями NA в R
Як переставити стовпці в R
Як перейменувати стовпці в R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *