A: so finden sie eindeutige zeilen über mehrere spalten hinweg
Sie können die folgenden Methoden verwenden, um eindeutige Zeilen über mehrere Spalten eines Datenrahmens in R zu finden:
Methode 1: Einzigartige Zeilen über mehrere Spalten hinweg finden (andere Spalten entfernen)
df_unique <- unique(df[c(' col1 ', ' col2 ')])
Methode 2: Einzigartige Zeilen über mehrere Spalten hinweg finden (andere Spalten beibehalten)
df_unique <- df[!duplicated(df[c(' col1 ', ' col2 ')]),]
Die folgenden Beispiele zeigen, wie jede dieser Methoden in der Praxis mit dem folgenden Datenrahmen verwendet wird:
#create data frame
df <- data. frame (conf=c('East', 'East', 'East', 'West', 'West', 'West'),
pos=c('G', 'G', 'F', 'G', 'F', 'F'),
dots=c(33, 28, 31, 39, 34, 40))
#view data frame
df
conf pos points
1 East G 33
2 East G 28
3 East F 31
4 West G 39
5 West F 34
6 West F 40
Methode 1: Einzigartige Zeilen über mehrere Spalten hinweg finden (andere Spalten entfernen)
Der folgende Code zeigt, wie eindeutige Zeilen in den Spalten „conf“ und „pos“ des Datenrahmens gefunden werden:
#find unique rows across conf and pos columns
df_unique <- unique(df[c(' conf ', ' pos ')])
#view results
df_unique
conf pos
1 East G
3 East
4 West G
5 West
Das Ergebnis sind vier einzigartige Linien.
Beachten Sie außerdem, dass die Punktespalte automatisch aus den Ergebnissen entfernt wurde.
Methode 2: Einzelne Zeilen über mehrere Spalten hinweg suchen (andere Spalten entfernen)
Der folgende Code zeigt, wie man einzelne Zeilen in den Spalten „conf “ und „pos“ des Datenrahmens findet und die Werte in der Spalte „points“ behält:
#find unique rows across conf and pos columns
df_unique <- df[!duplicated(df[c(' conf ', ' pos ')]),]
#view results
df_unique
conf pos points
1 East G 33
3 East F 31
4 West G 39
5 West F 34
Beachten Sie, dass in den Spalten „conf “ und „pos“ nur einzelne Zeilen vorhanden sind und die Werte in der Spalte „ points“ erhalten bleiben.
Es ist wichtig zu beachten, dass nur der Wert des ersten eindeutigen Vorkommens beibehalten wird.
Beispielsweise gab es in den ersten beiden Spalten zwei Zeilen mit „East“ und „G“, aber nur der Punktwert (33) für das erste Vorkommen dieser eindeutigen Kombination wurde im endgültigen Datenrahmen beibehalten.
Ebenso gab es zwei Zeilen mit „West“ und „F“ in den ersten beiden Spalten, aber nur der Punktwert (34) für das erste Vorkommen dieser eindeutigen Kombination wurde im endgültigen Datenrahmen beibehalten.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:
So finden Sie eindeutige Werte in einer Spalte in R
So zählen Sie eindeutige Werte nach Gruppen in R
So filtern Sie eindeutige Werte mit dplyr