Hoe unieke waarden te filteren met dplyr


U kunt de volgende methoden gebruiken om unieke waarden in een dataframe in R te filteren met behulp van het dplyr- pakket:

Methode 1: Filter unieke waarden in een kolom

 df %>% distinct(var1)

Methode 2: Filter unieke waarden in meerdere kolommen

 df %>% distinct(var1, var2)

Methode 3: Filter unieke waarden in alle kolommen

 df %>% distinct()

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met het volgende dataframe in R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 to 10 8
3 to 8 4
4 to 6 3
5 B 15 10
6 B 15 11
7 B 12 7
8 B 12 7

Voorbeeld 1: Filter unieke waarden in kolom

We kunnen de volgende code gebruiken om alleen unieke waarden in de teamkolom te filteren:

 library (dplyr)

#select only unique values in team column
df %>% distinct(team)

  team
1A
2 B

Houd er rekening mee dat alleen unieke waarden uit de teamkolom worden geretourneerd.

Voorbeeld 2: Filter unieke waarden in meerdere kolommen

We kunnen de volgende code gebruiken om unieke waarden in de team- en puntenkolommen te filteren:

 library (dplyr)

#select unique values in team and points columns
df %>% distinct(team, points)

  team points
1 to 10
2 to 8
3 to 6
4 B 15
5 B 12

Houd er rekening mee dat alleen unieke waarden uit de team- en puntenkolommen worden geretourneerd.

Voorbeeld 3: Filter unieke waarden in alle kolommen

We kunnen de volgende code gebruiken om unieke waarden over alle kolommen in het dataframe te filteren:

 library (dplyr)

#select unique values across all columns
df %>% distinct()

  team points rebounds
1 to 10 8
2 to 8 4
3 to 6 3
4 B 15 10
5 B 15 11
6 B 12 7

Houd er rekening mee dat unieke waarden uit alle drie de kolommen worden geretourneerd.

Opmerking : u kunt de volledige documentatie van de afzonderlijke functie in dplyr hier vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in dplyr uitvoert:

Kolommen selecteren op index met behulp van dplyr
Hoe u de eerste rij per groep selecteert met dplyr
Hoe u op meerdere voorwaarden kunt filteren met behulp van dplyr
Hoe u rijen kunt filteren die een bepaalde tekenreeks bevatten met behulp van dplyr

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert