Como usar o operador %in% em r (com exemplos)


O operador %in% em R permite determinar se um elemento pertence ou não a um vetor ou quadro de dados.

Este tutorial fornece três exemplos de uso desse recurso em diferentes cenários.

Exemplo 1: Usando %in% com vetores

Podemos usar o operador %in% para determinar quantos elementos de um vetor pertencem a outro vetor:

 #define two vectors of data
data1 <- c(3, 5, 7, 7, 14, 19, 22, 25)

data2 <- c(1, 2, 3, 4, 5)

#produce new vector that contains elements of data1 that are in data2
data1[data1 %in% data2]

[1] 3 5

Podemos ver que os valores 3 e 5 são os únicos elementos do vetor rotulado data2 que estão no vetor rotulado data1 .

Exemplo 2: Use %in% para filtrar quadros de dados

Também podemos usar o operador %in% para filtrar linhas em um quadro de dados contendo determinados valores:

 #define data frame
df <- data.frame(team=c('A', 'A', 'B', 'B', 'B', 'C'),
                 points=c(67, 72, 77, 89, 84, 97),
                 assists=c(14, 16, 12, 22, 25, 20))

#view data frame
df

  team points assists
1 A 67 14
2 A 72 16
3 B 77 12
4 B 89 22
5 B 84 25
6 C 97 20

#produce new data frame that only contains rows where team is 'B'
df_new <- df[df$team %in% c(' B '), ]
df_new

  team points assists
3 B 77 12
4 B 89 22
5 B 84 25

#produce new data frame that only contains rows where team is 'B' or 'C'
df_new2 <- df[df$team %in% c(' B ', ' C '), ]
df_new2

  team points assists
3 B 77 12
4 B 89 22
5 B 84 25
6 C 97 20

Exemplo 3: Use %in% para criar colunas de quadro de dados

Também podemos usar o operador %in% para criar novas colunas de quadro de dados.

Por exemplo, o código a seguir mostra como criar uma nova coluna chamada divisão que coloca as equipes “A” e “C” como “Leste” e as equipes “B” como “Oeste”:

 library (dplyr)

#define data frame
df <- data.frame(team=c('A', 'A', 'B', 'B', 'B', 'C'),
                 points=c(67, 72, 77, 89, 84, 97),
                 assists=c(14, 16, 12, 22, 25, 20))

#view data frame
df

  team points assists
1 A 67 14
2 A 72 16
3 B 77 12
4 B 89 22
5 B 84 25
6 C 97 20

#create new column called division
df$division = if_else (df$team %in% c(' A ', ' C '), ' East ', ' West ')
df

  team points assists division
1 A 67 14 East
2 A 72 16 East
3 B 77 12 West
4 B 89 22 West
5 B 84 25 West
6 C 97 20 East

Recursos adicionais

Como combinar duas colunas em uma em R
Como adicionar linhas a um quadro de dados em R
Como comparar duas colunas em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *