A: rijen in een dataframe selecteren op basis van vectorwaarden
U kunt een van de volgende methoden gebruiken om rijen uit een dataframe in R te selecteren op basis van de waarden van een vector:
Methode 1: Gebruik Base R
new_df <- df[df$column_name %in% values_vector, ]
Methode 2: Gebruik het dplyr-pakket
library (dplyr)
new_df <- df %>% filter(column_name %in% values_vector)
De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met het volgende dataframe in R:
#create data frame
df <- data. frame (division=c('West', 'West', 'East', 'East', 'North'),
points=c(120, 100, 104, 98, 105),
assists=c(30, 35, 64, 28, 23))
#view data frame
df
assists points division
1 West 120 30
2 West 100 35
3 East 104 64
4 East 98 28
5 North 105 23
Voorbeeld 1: Gebruik Basis R om rijen te selecteren op basis van vectorwaarden
We kunnen de volgende code gebruiken om alleen de rijen uit het oorspronkelijke gegevensframe te selecteren waarbij de waarde in de deelkolom gelijk is aan ‚West‘ of ‚Noord‘.
#define values of interest
my_values <- c(' West ', ' North ')
#select rows that contain 'West' or 'North' in division column
new_df <- df[df$division %in% my_values, ]
#view results
new_df
assists points division
1 West 120 30
2 West 100 35
5 North 105 23
Het nieuwe dataframe bevat alleen rijen waarvan de waarde in de deelkolom gelijk is aan ‚West‘ of ‚Noord‘.
Voorbeeld 2: Gebruik dplyr om rijen te selecteren op basis van vectorwaarden
We kunnen ook de functie filter() uit het dplyr- pakket in R gebruiken om alleen de rijen uit het originele dataframe te selecteren waarbij de waarde in de deelkolom gelijk is aan „West“ of „Noord“.
library (dplyr)
#define values of interest
my_values <- c(' West ', ' North ')
#select rows that contain 'West' or 'North' in division column
new_df <- df %>% filter(division %in% my_values)
#view results
new_df
assists points division
1 West 120 30
2 West 100 35
3 North 105 23
Het nieuwe dataframe bevat alleen rijen waarvan de waarde in de deelkolom gelijk is aan ‚West‘ of ‚Noord‘.
Opmerking : de base R- en dplyr-methoden leveren dezelfde resultaten op. De dplyr-methode zal echter sneller zijn bij het werken met extreem grote dataframes.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:
Hoe willekeurige lijnen in R te selecteren met dplyr
Rijen selecteren op voorwaarde in R
Hoe u rijen selecteert waarin waarde wordt weergegeven in een willekeurige kolom in R