So filtern sie eindeutige werte mit dplyr
Sie können die folgenden Methoden verwenden, um mithilfe des dplyr- Pakets eindeutige Werte in einem Datenrahmen in R zu filtern:
Methode 1: Eindeutige Werte in einer Spalte filtern
df %>% distinct(var1)
Methode 2: Filtern Sie eindeutige Werte in mehreren Spalten
df %>% distinct(var1, var2)
Methode 3: Filtern Sie eindeutige Werte in allen Spalten
df %>% distinct()
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen in R verwendet wird:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))
#view data frame
df
team points rebounds
1 to 10 8
2 to 10 8
3 to 8 4
4 to 6 3
5 B 15 10
6 B 15 11
7 B 12 7
8 B 12 7
Beispiel 1: Eindeutige Werte in der Spalte filtern
Wir können den folgenden Code verwenden, um eindeutige Werte nur in der Teamspalte zu filtern:
library (dplyr)
#select only unique values in team column
df %>% distinct(team)
team
1A
2 B
Beachten Sie, dass nur eindeutige Werte aus der Teamspalte zurückgegeben werden.
Beispiel 2: Filtern Sie eindeutige Werte in mehreren Spalten
Mit dem folgenden Code können wir eindeutige Werte in den Team- und Punktespalten filtern:
library (dplyr)
#select unique values in team and points columns
df %>% distinct(team, points)
team points
1 to 10
2 to 8
3 to 6
4 B 15
5 B 12
Beachten Sie, dass nur eindeutige Werte aus den Spalten „Team “ und „Punkte“ zurückgegeben werden.
Beispiel 3: Filtern Sie eindeutige Werte in allen Spalten
Wir können den folgenden Code verwenden, um eindeutige Werte über alle Spalten im Datenrahmen hinweg zu filtern:
library (dplyr)
#select unique values across all columns
df %>% distinct()
team points rebounds
1 to 10 8
2 to 8 4
3 to 6 3
4 B 15 10
5 B 15 11
6 B 12 7
Beachten Sie, dass eindeutige Werte aus allen drei Spalten zurückgegeben werden.
Hinweis : Die vollständige Dokumentation der separaten Funktion in dplyr finden Sie hier .
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere gängige Vorgänge in dplyr ausführen:
So wählen Sie Spalten nach Index mit dplyr aus
So wählen Sie mit dplyr die erste Zeile nach Gruppe aus
So filtern Sie mit dplyr nach mehreren Bedingungen
So filtern Sie Zeilen, die eine bestimmte Zeichenfolge enthalten, mit dplyr