Come utilizzare l'operatore %in% in r (con esempi)


L’operatore %in% in R consente di determinare se un elemento appartiene o meno a un vettore o a un frame di dati.

Questo tutorial fornisce tre esempi di utilizzo di questa funzionalità in diversi scenari.

Esempio 1: utilizzo di %in% con i vettori

Possiamo usare l’operatore %in% per determinare quanti elementi di un vettore appartengono a un altro vettore:

 #define two vectors of data
data1 <- c(3, 5, 7, 7, 14, 19, 22, 25)

data2 <- c(1, 2, 3, 4, 5)

#produce new vector that contains elements of data1 that are in data2
data1[data1 %in% data2]

[1] 3 5

Possiamo vedere che i valori 3 e 5 sono gli unici elementi del vettore etichettato data2 che si trovano nel vettore etichettato data1 .

Esempio 2: utilizzare %in% per filtrare i frame di dati

Possiamo anche utilizzare l’operatore %in% per filtrare le righe in un frame di dati contenente determinati valori:

 #define data frame
df <- data.frame(team=c('A', 'A', 'B', 'B', 'B', 'C'),
                 points=c(67, 72, 77, 89, 84, 97),
                 assists=c(14, 16, 12, 22, 25, 20))

#view data frame
df

  team points assists
1 A 67 14
2 A 72 16
3 B 77 12
4 B 89 22
5 B 84 25
6 C 97 20

#produce new data frame that only contains rows where team is 'B'
df_new <- df[df$team %in% c(' B '), ]
df_new

  team points assists
3 B 77 12
4 B 89 22
5 B 84 25

#produce new data frame that only contains rows where team is 'B' or 'C'
df_new2 <- df[df$team %in% c(' B ', ' C '), ]
df_new2

  team points assists
3 B 77 12
4 B 89 22
5 B 84 25
6 C 97 20

Esempio 3: utilizzare %in% per creare colonne di frame di dati

Possiamo anche utilizzare l’operatore %in% per creare nuove colonne di frame di dati.

Ad esempio, il codice seguente mostra come creare una nuova colonna denominata divisione che posiziona le squadre “A” e “C” come “Est” e le squadre “B” come “Ovest”:

 library (dplyr)

#define data frame
df <- data.frame(team=c('A', 'A', 'B', 'B', 'B', 'C'),
                 points=c(67, 72, 77, 89, 84, 97),
                 assists=c(14, 16, 12, 22, 25, 20))

#view data frame
df

  team points assists
1 A 67 14
2 A 72 16
3 B 77 12
4 B 89 22
5 B 84 25
6 C 97 20

#create new column called division
df$division = if_else (df$team %in% c(' A ', ' C '), ' East ', ' West ')
df

  team points assists division
1 A 67 14 East
2 A 72 16 East
3 B 77 12 West
4 B 89 22 West
5 B 84 25 West
6 C 97 20 East

Risorse addizionali

Come combinare due colonne in una in R
Come aggiungere righe a un frame di dati in R
Come confrontare due colonne in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *