Jak filtrować unikalne wartości za pomocą dplyr


Do filtrowania unikalnych wartości w ramce danych w R przy użyciu pakietu dplyr możesz użyć następujących metod:

Metoda 1: Filtruj unikalne wartości w kolumnie

 df %>% distinct(var1)

Metoda 2: Filtruj unikalne wartości w wielu kolumnach

 df %>% distinct(var1, var2)

Metoda 3: Filtruj unikalne wartości we wszystkich kolumnach

 df %>% distinct()

Poniższe przykłady pokazują, jak w praktyce wykorzystać każdą metodę z następującą ramką danych w R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 to 10 8
3 to 8 4
4 to 6 3
5 B 15 10
6 B 15 11
7 B 12 7
8 B 12 7

Przykład 1: Filtruj unikalne wartości w kolumnie

Możemy użyć poniższego kodu do filtrowania unikalnych wartości tylko w kolumnie zespół :

 library (dplyr)

#select only unique values in team column
df %>% distinct(team)

  team
1A
2 B

Pamiętaj, że zwracane są tylko unikalne wartości z kolumny zespołu .

Przykład 2: Filtruj unikalne wartości w wielu kolumnach

Za pomocą poniższego kodu możemy filtrować unikalne wartości w kolumnach drużyny i punktów :

 library (dplyr)

#select unique values in team and points columns
df %>% distinct(team, points)

  team points
1 to 10
2 to 8
3 to 6
4 B 15
5 B 12

Pamiętaj, że zwracane są tylko unikalne wartości z kolumn drużyny i punktów .

Przykład 3: Filtruj unikalne wartości we wszystkich kolumnach

Możemy użyć poniższego kodu do filtrowania unikalnych wartości we wszystkich kolumnach w ramce danych:

 library (dplyr)

#select unique values across all columns
df %>% distinct()

  team points rebounds
1 to 10 8
2 to 8 4
3 to 6 3
4 B 15 10
5 B 15 11
6 B 12 7

Należy pamiętać, że zwracane są unikalne wartości ze wszystkich trzech kolumn.

Uwaga : Pełną dokumentację oddzielnej funkcji w dplyr można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje w dplyr:

Jak wybrać kolumny według indeksu za pomocą dplyr
Jak wybrać pierwszy wiersz według grupy za pomocą dplyr
Jak filtrować według wielu warunków za pomocą dplyr
Jak filtrować wiersze zawierające określony ciąg za pomocą dplyr

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *