Hoe de %in% operator in r te gebruiken (met voorbeelden)
Met de operator %in% in R kunt u bepalen of een element wel of niet tot een vector- of dataframe behoort.
Deze zelfstudie biedt drie voorbeelden van het gebruik van deze functie in verschillende scenario’s.
Voorbeeld 1: %in% gebruiken met vectoren
We kunnen de operator %in% gebruiken om te bepalen hoeveel elementen van een vector tot een andere vector behoren:
#define two vectors of data data1 <- c(3, 5, 7, 7, 14, 19, 22, 25) data2 <- c(1, 2, 3, 4, 5) #produce new vector that contains elements of data1 that are in data2 data1[data1 %in% data2] [1] 3 5
We kunnen zien dat de waarden 3 en 5 de enige elementen zijn van de vector met het label data2 die zich in de vector met het label data1 bevinden.
Voorbeeld 2: Gebruik %in% om dataframes te filteren
We kunnen ook de operator %in% gebruiken om rijen in een dataframe te filteren die bepaalde waarden bevatten:
#define data frame df <- data.frame(team=c('A', 'A', 'B', 'B', 'B', 'C'), points=c(67, 72, 77, 89, 84, 97), assists=c(14, 16, 12, 22, 25, 20)) #view data frame df team points assists 1 A 67 14 2 A 72 16 3 B 77 12 4 B 89 22 5 B 84 25 6 C 97 20 #produce new data frame that only contains rows where team is 'B' df_new <- df[df$team %in% c(' B '), ] df_new team points assists 3 B 77 12 4 B 89 22 5 B 84 25 #produce new data frame that only contains rows where team is 'B' or 'C' df_new2 <- df[df$team %in% c(' B ', ' C '), ] df_new2 team points assists 3 B 77 12 4 B 89 22 5 B 84 25 6 C 97 20
Voorbeeld 3: Gebruik %in% om dataframekolommen te maken
We kunnen ook de operator %in% gebruiken om nieuwe dataframekolommen te maken.
De volgende code laat bijvoorbeeld zien hoe u een nieuwe kolom maakt met de naam divisie , waarin teams „A“ en „C“ als „Oost“ en teams „B“ als „West“ worden geplaatst:
library (dplyr) #define data frame df <- data.frame(team=c('A', 'A', 'B', 'B', 'B', 'C'), points=c(67, 72, 77, 89, 84, 97), assists=c(14, 16, 12, 22, 25, 20)) #view data frame df team points assists 1 A 67 14 2 A 72 16 3 B 77 12 4 B 89 22 5 B 84 25 6 C 97 20 #create new column called division df$division = if_else (df$team %in% c(' A ', ' C '), ' East ', ' West ') df team points assists division 1 A 67 14 East 2 A 72 16 East 3 B 77 12 West 4 B 89 22 West 5 B 84 25 West 6 C 97 20 East
Aanvullende bronnen
Hoe twee kolommen te combineren tot één in R
Rijen toevoegen aan een dataframe in R
Hoe twee kolommen in R te vergelijken