A: как выбрать строки во фрейме данных на основе векторных значений


Вы можете использовать любой из следующих методов для выбора строк из фрейма данных в R на основе значений вектора:

Метод 1: используйте базу R

 new_df <- df[df$column_name %in% values_vector, ]

Способ 2. Используйте пакет dplyr.

 library (dplyr)

new_df <- df %>% filter(column_name %in% values_vector)

В следующих примерах показано, как использовать каждый метод на практике со следующим фреймом данных в R:

 #create data frame
df <- data. frame (division=c('West', 'West', 'East', 'East', 'North'),
                 points=c(120, 100, 104, 98, 105),
                 assists=c(30, 35, 64, 28, 23))

#view data frame
df

  assists points division
1 West 120 30
2 West 100 35
3 East 104 64
4 East 98 28
5 North 105 23

Пример 1. Используйте Base R для выбора строк на основе значений вектора

Мы можем использовать следующий код, чтобы выбрать только те строки из исходного фрейма данных, где значение в столбце деления равно «Запад» или «Север».

 #define values of interest
my_values <- c(' West ', ' North ')

#select rows that contain 'West' or 'North' in division column
new_df <- df[df$division %in% my_values, ]

#view results
new_df

  assists points division
1 West 120 30
2 West 100 35
5 North 105 23

Новый фрейм данных содержит только строки, значение которых в столбце деления равно «Запад» или «Север».

Пример 2. Используйте dplyr для выбора строк на основе векторных значений.

Мы также можем использовать функцию filter() из пакета dplyr в R, чтобы выбрать только те строки из исходного фрейма данных, где значение в столбце деления равно «Запад» или «Север».

 library (dplyr)

#define values of interest
my_values <- c(' West ', ' North ')

#select rows that contain 'West' or 'North' in division column
new_df <- df %>% filter(division %in% my_values)

#view results
new_df

  assists points division
1 West 120 30
2 West 100 35
3 North 105 23

Новый фрейм данных содержит только строки, значение которых в столбце деления равно «Запад» или «Север».

Примечание . Базовые методы R и dplyr дают одинаковые результаты. Однако метод dplyr будет работать быстрее при работе с очень большими кадрами данных.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:

Как выбрать случайные строки в R с помощью dplyr
Как выбрать строки по условию в R
Как выбрать строки, в которых значение отображается в любом столбце в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *