So filtern sie eindeutige werte mit dplyr


Sie können die folgenden Methoden verwenden, um mithilfe des dplyr- Pakets eindeutige Werte in einem Datenrahmen in R zu filtern:

Methode 1: Eindeutige Werte in einer Spalte filtern

 df %>% distinct(var1)

Methode 2: Filtern Sie eindeutige Werte in mehreren Spalten

 df %>% distinct(var1, var2)

Methode 3: Filtern Sie eindeutige Werte in allen Spalten

 df %>% distinct()

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen in R verwendet wird:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 to 10 8
3 to 8 4
4 to 6 3
5 B 15 10
6 B 15 11
7 B 12 7
8 B 12 7

Beispiel 1: Eindeutige Werte in der Spalte filtern

Wir können den folgenden Code verwenden, um eindeutige Werte nur in der Teamspalte zu filtern:

 library (dplyr)

#select only unique values in team column
df %>% distinct(team)

  team
1A
2 B

Beachten Sie, dass nur eindeutige Werte aus der Teamspalte zurückgegeben werden.

Beispiel 2: Filtern Sie eindeutige Werte in mehreren Spalten

Mit dem folgenden Code können wir eindeutige Werte in den Team- und Punktespalten filtern:

 library (dplyr)

#select unique values in team and points columns
df %>% distinct(team, points)

  team points
1 to 10
2 to 8
3 to 6
4 B 15
5 B 12

Beachten Sie, dass nur eindeutige Werte aus den Spalten „Team “ und „Punkte“ zurückgegeben werden.

Beispiel 3: Filtern Sie eindeutige Werte in allen Spalten

Wir können den folgenden Code verwenden, um eindeutige Werte über alle Spalten im Datenrahmen hinweg zu filtern:

 library (dplyr)

#select unique values across all columns
df %>% distinct()

  team points rebounds
1 to 10 8
2 to 8 4
3 to 6 3
4 B 15 10
5 B 15 11
6 B 12 7

Beachten Sie, dass eindeutige Werte aus allen drei Spalten zurückgegeben werden.

Hinweis : Die vollständige Dokumentation der separaten Funktion in dplyr finden Sie hier .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere gängige Vorgänge in dplyr ausführen:

So wählen Sie Spalten nach Index mit dplyr aus
So wählen Sie mit dplyr die erste Zeile nach Gruppe aus
So filtern Sie mit dplyr nach mehreren Bedingungen
So filtern Sie Zeilen, die eine bestimmte Zeichenfolge enthalten, mit dplyr

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert