Odp.: jak wybierać wiersze w ramce danych na podstawie wartości wektorowych
Możesz użyć dowolnej z poniższych metod, aby wybrać wiersze z ramki danych w R na podstawie wartości wektora:
Metoda 1: Użyj podstawy R
new_df <- df[df$column_name %in% values_vector, ]
Metoda 2: Użyj pakietu dplyr
library (dplyr)
new_df <- df %>% filter(column_name %in% values_vector)
Poniższe przykłady pokazują, jak w praktyce wykorzystać każdą metodę z następującą ramką danych w R:
#create data frame
df <- data. frame (division=c('West', 'West', 'East', 'East', 'North'),
points=c(120, 100, 104, 98, 105),
assists=c(30, 35, 64, 28, 23))
#view data frame
df
assists points division
1 West 120 30
2 West 100 35
3 East 104 64
4 East 98 28
5 North 105 23
Przykład 1: Użyj podstawy R, aby wybrać wiersze na podstawie wartości wektorowych
Możemy użyć poniższego kodu, aby wybrać tylko te wiersze z oryginalnej ramki danych, których wartość w kolumnie dzielenia jest równa „Zachód” lub „Północ”.
#define values of interest
my_values <- c(' West ', ' North ')
#select rows that contain 'West' or 'North' in division column
new_df <- df[df$division %in% my_values, ]
#view results
new_df
assists points division
1 West 120 30
2 West 100 35
5 North 105 23
Nowa ramka danych zawiera tylko wiersze, których wartość w kolumnie podziału jest równa „Zachód” lub „Północ”.
Przykład 2: Użyj dplyr, aby wybrać wiersze na podstawie wartości wektorowych
Możemy także użyć funkcji filter() z pakietu dplyr w R, aby wybrać tylko te wiersze z oryginalnej ramki danych, których wartość w kolumnie dzielenia jest równa „Zachód” lub „Północ”.
library (dplyr)
#define values of interest
my_values <- c(' West ', ' North ')
#select rows that contain 'West' or 'North' in division column
new_df <- df %>% filter(division %in% my_values)
#view results
new_df
assists points division
1 West 120 30
2 West 100 35
3 North 105 23
Nowa ramka danych zawiera tylko wiersze, których wartość w kolumnie podziału jest równa „Zachód” lub „Północ”.
Uwaga : Metody podstawowe R i dplyr dają takie same wyniki. Jednak metoda dplyr będzie zwykle szybsza podczas pracy z bardzo dużymi ramkami danych.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:
Jak wybrać losowe linie w R za pomocą dplyr
Jak wybrać wiersze według warunku w R
Jak wybrać wiersze, w których wartość pojawia się w dowolnej kolumnie w R