Come filtrare valori univoci utilizzando dplyr


È possibile utilizzare i seguenti metodi per filtrare valori univoci in un frame di dati in R utilizzando il pacchetto dplyr :

Metodo 1: filtra i valori univoci in una colonna

 df %>% distinct(var1)

Metodo 2: filtra valori univoci in più colonne

 df %>% distinct(var1, var2)

Metodo 3: filtra i valori univoci in tutte le colonne

 df %>% distinct()

I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con il seguente frame di dati in R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 to 10 8
3 to 8 4
4 to 6 3
5 B 15 10
6 B 15 11
7 B 12 7
8 B 12 7

Esempio 1: filtra valori univoci nella colonna

Possiamo utilizzare il seguente codice per filtrare valori univoci solo nella colonna team :

 library (dplyr)

#select only unique values in team column
df %>% distinct(team)

  team
1A
2 B

Tieni presente che vengono restituiti solo valori univoci dalla colonna del team .

Esempio 2: filtra valori univoci in più colonne

Possiamo utilizzare il seguente codice per filtrare valori univoci nelle colonne squadra e punti :

 library (dplyr)

#select unique values in team and points columns
df %>% distinct(team, points)

  team points
1 to 10
2 to 8
3 to 6
4 B 15
5 B 12

Tieni presente che vengono restituiti solo valori univoci dalle colonne squadra e punti .

Esempio 3: filtra valori univoci in tutte le colonne

Possiamo utilizzare il seguente codice per filtrare valori univoci su tutte le colonne nel frame di dati:

 library (dplyr)

#select unique values across all columns
df %>% distinct()

  team points rebounds
1 to 10 8
2 to 8 4
3 to 6 3
4 B 15 10
5 B 15 11
6 B 12 7

Tieni presente che vengono restituiti valori univoci da tutte e tre le colonne.

Nota : puoi trovare la documentazione completa della funzione separata in dplyr qui .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni in dplyr:

Come selezionare le colonne per indice utilizzando dplyr
Come selezionare la prima riga per gruppo utilizzando dplyr
Come filtrare in base a più condizioni utilizzando dplyr
Come filtrare le righe contenenti una determinata stringa utilizzando dplyr

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *