Jak filtrować unikalne wartości za pomocą dplyr
Do filtrowania unikalnych wartości w ramce danych w R przy użyciu pakietu dplyr możesz użyć następujących metod:
Metoda 1: Filtruj unikalne wartości w kolumnie
df %>% distinct(var1)
Metoda 2: Filtruj unikalne wartości w wielu kolumnach
df %>% distinct(var1, var2)
Metoda 3: Filtruj unikalne wartości we wszystkich kolumnach
df %>% distinct()
Poniższe przykłady pokazują, jak w praktyce wykorzystać każdą metodę z następującą ramką danych w R:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))
#view data frame
df
team points rebounds
1 to 10 8
2 to 10 8
3 to 8 4
4 to 6 3
5 B 15 10
6 B 15 11
7 B 12 7
8 B 12 7
Przykład 1: Filtruj unikalne wartości w kolumnie
Możemy użyć poniższego kodu do filtrowania unikalnych wartości tylko w kolumnie zespół :
library (dplyr)
#select only unique values in team column
df %>% distinct(team)
team
1A
2 B
Pamiętaj, że zwracane są tylko unikalne wartości z kolumny zespołu .
Przykład 2: Filtruj unikalne wartości w wielu kolumnach
Za pomocą poniższego kodu możemy filtrować unikalne wartości w kolumnach drużyny i punktów :
library (dplyr)
#select unique values in team and points columns
df %>% distinct(team, points)
team points
1 to 10
2 to 8
3 to 6
4 B 15
5 B 12
Pamiętaj, że zwracane są tylko unikalne wartości z kolumn drużyny i punktów .
Przykład 3: Filtruj unikalne wartości we wszystkich kolumnach
Możemy użyć poniższego kodu do filtrowania unikalnych wartości we wszystkich kolumnach w ramce danych:
library (dplyr)
#select unique values across all columns
df %>% distinct()
team points rebounds
1 to 10 8
2 to 8 4
3 to 6 3
4 B 15 10
5 B 15 11
6 B 12 7
Należy pamiętać, że zwracane są unikalne wartości ze wszystkich trzech kolumn.
Uwaga : Pełną dokumentację oddzielnej funkcji w dplyr można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje w dplyr:
Jak wybrać kolumny według indeksu za pomocą dplyr
Jak wybrać pierwszy wiersz według grupy za pomocą dplyr
Jak filtrować według wielu warunków za pomocą dplyr
Jak filtrować wiersze zawierające określony ciąg za pomocą dplyr