Hoe de %in% operator in r te gebruiken (met voorbeelden)


Met de operator %in% in R kunt u bepalen of een element wel of niet tot een vector- of dataframe behoort.

Deze zelfstudie biedt drie voorbeelden van het gebruik van deze functie in verschillende scenario’s.

Voorbeeld 1: %in% gebruiken met vectoren

We kunnen de operator %in% gebruiken om te bepalen hoeveel elementen van een vector tot een andere vector behoren:

 #define two vectors of data
data1 <- c(3, 5, 7, 7, 14, 19, 22, 25)

data2 <- c(1, 2, 3, 4, 5)

#produce new vector that contains elements of data1 that are in data2
data1[data1 %in% data2]

[1] 3 5

We kunnen zien dat de waarden 3 en 5 de enige elementen zijn van de vector met het label data2 die zich in de vector met het label data1 bevinden.

Voorbeeld 2: Gebruik %in% om dataframes te filteren

We kunnen ook de operator %in% gebruiken om rijen in een dataframe te filteren die bepaalde waarden bevatten:

 #define data frame
df <- data.frame(team=c('A', 'A', 'B', 'B', 'B', 'C'),
                 points=c(67, 72, 77, 89, 84, 97),
                 assists=c(14, 16, 12, 22, 25, 20))

#view data frame
df

  team points assists
1 A 67 14
2 A 72 16
3 B 77 12
4 B 89 22
5 B 84 25
6 C 97 20

#produce new data frame that only contains rows where team is 'B'
df_new <- df[df$team %in% c(' B '), ]
df_new

  team points assists
3 B 77 12
4 B 89 22
5 B 84 25

#produce new data frame that only contains rows where team is 'B' or 'C'
df_new2 <- df[df$team %in% c(' B ', ' C '), ]
df_new2

  team points assists
3 B 77 12
4 B 89 22
5 B 84 25
6 C 97 20

Voorbeeld 3: Gebruik %in% om dataframekolommen te maken

We kunnen ook de operator %in% gebruiken om nieuwe dataframekolommen te maken.

De volgende code laat bijvoorbeeld zien hoe u een nieuwe kolom maakt met de naam divisie , waarin teams „A“ en „C“ als „Oost“ en teams „B“ als „West“ worden geplaatst:

 library (dplyr)

#define data frame
df <- data.frame(team=c('A', 'A', 'B', 'B', 'B', 'C'),
                 points=c(67, 72, 77, 89, 84, 97),
                 assists=c(14, 16, 12, 22, 25, 20))

#view data frame
df

  team points assists
1 A 67 14
2 A 72 16
3 B 77 12
4 B 89 22
5 B 84 25
6 C 97 20

#create new column called division
df$division = if_else (df$team %in% c(' A ', ' C '), ' East ', ' West ')
df

  team points assists division
1 A 67 14 East
2 A 72 16 East
3 B 77 12 West
4 B 89 22 West
5 B 84 25 West
6 C 97 20 East

Aanvullende bronnen

Hoe twee kolommen te combineren tot één in R
Rijen toevoegen aan een dataframe in R
Hoe twee kolommen in R te vergelijken

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert