Odp.: jak wybierać wiersze w ramce danych na podstawie wartości wektorowych


Możesz użyć dowolnej z poniższych metod, aby wybrać wiersze z ramki danych w R na podstawie wartości wektora:

Metoda 1: Użyj podstawy R

 new_df <- df[df$column_name %in% values_vector, ]

Metoda 2: Użyj pakietu dplyr

 library (dplyr)

new_df <- df %>% filter(column_name %in% values_vector)

Poniższe przykłady pokazują, jak w praktyce wykorzystać każdą metodę z następującą ramką danych w R:

 #create data frame
df <- data. frame (division=c('West', 'West', 'East', 'East', 'North'),
                 points=c(120, 100, 104, 98, 105),
                 assists=c(30, 35, 64, 28, 23))

#view data frame
df

  assists points division
1 West 120 30
2 West 100 35
3 East 104 64
4 East 98 28
5 North 105 23

Przykład 1: Użyj podstawy R, aby wybrać wiersze na podstawie wartości wektorowych

Możemy użyć poniższego kodu, aby wybrać tylko te wiersze z oryginalnej ramki danych, których wartość w kolumnie dzielenia jest równa „Zachód” lub „Północ”.

 #define values of interest
my_values <- c(' West ', ' North ')

#select rows that contain 'West' or 'North' in division column
new_df <- df[df$division %in% my_values, ]

#view results
new_df

  assists points division
1 West 120 30
2 West 100 35
5 North 105 23

Nowa ramka danych zawiera tylko wiersze, których wartość w kolumnie podziału jest równa „Zachód” lub „Północ”.

Przykład 2: Użyj dplyr, aby wybrać wiersze na podstawie wartości wektorowych

Możemy także użyć funkcji filter() z pakietu dplyr w R, aby wybrać tylko te wiersze z oryginalnej ramki danych, których wartość w kolumnie dzielenia jest równa „Zachód” lub „Północ”.

 library (dplyr)

#define values of interest
my_values <- c(' West ', ' North ')

#select rows that contain 'West' or 'North' in division column
new_df <- df %>% filter(division %in% my_values)

#view results
new_df

  assists points division
1 West 120 30
2 West 100 35
3 North 105 23

Nowa ramka danych zawiera tylko wiersze, których wartość w kolumnie podziału jest równa „Zachód” lub „Północ”.

Uwaga : Metody podstawowe R i dplyr dają takie same wyniki. Jednak metoda dplyr będzie zwykle szybsza podczas pracy z bardzo dużymi ramkami danych.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak wybrać losowe linie w R za pomocą dplyr
Jak wybrać wiersze według warunku w R
Jak wybrać wiersze, w których wartość pojawia się w dowolnej kolumnie w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *