A: so finden sie eindeutige zeilen über mehrere spalten hinweg


Sie können die folgenden Methoden verwenden, um eindeutige Zeilen über mehrere Spalten eines Datenrahmens in R zu finden:

Methode 1: Einzigartige Zeilen über mehrere Spalten hinweg finden (andere Spalten entfernen)

 df_unique <- unique(df[c(' col1 ', ' col2 ')])

Methode 2: Einzigartige Zeilen über mehrere Spalten hinweg finden (andere Spalten beibehalten)

 df_unique <- df[!duplicated(df[c(' col1 ', ' col2 ')]),]

Die folgenden Beispiele zeigen, wie jede dieser Methoden in der Praxis mit dem folgenden Datenrahmen verwendet wird:

 #create data frame
df <- data. frame (conf=c('East', 'East', 'East', 'West', 'West', 'West'),
                 pos=c('G', 'G', 'F', 'G', 'F', 'F'),
                 dots=c(33, 28, 31, 39, 34, 40))

#view data frame
df

  conf pos points
1 East G 33
2 East G 28
3 East F 31
4 West G 39
5 West F 34
6 West F 40

Methode 1: Einzigartige Zeilen über mehrere Spalten hinweg finden (andere Spalten entfernen)

Der folgende Code zeigt, wie eindeutige Zeilen in den Spalten „conf“ und „pos“ des Datenrahmens gefunden werden:

 #find unique rows across conf and pos columns
df_unique <- unique(df[c(' conf ', ' pos ')])

#view results
df_unique 

  conf pos
1 East G
3 East
4 West G
5 West

Das Ergebnis sind vier einzigartige Linien.

Beachten Sie außerdem, dass die Punktespalte automatisch aus den Ergebnissen entfernt wurde.

Methode 2: Einzelne Zeilen über mehrere Spalten hinweg suchen (andere Spalten entfernen)

Der folgende Code zeigt, wie man einzelne Zeilen in den Spalten „conf “ und „pos“ des Datenrahmens findet und die Werte in der Spalte „points“ behält:

 #find unique rows across conf and pos columns
df_unique <- df[!duplicated(df[c(' conf ', ' pos ')]),]

#view results
df_unique 

  conf pos points
1 East G 33
3 East F 31
4 West G 39
5 West F 34

Beachten Sie, dass in den Spalten „conf “ und „pos“ nur einzelne Zeilen vorhanden sind und die Werte in der Spalte „ points“ erhalten bleiben.

Es ist wichtig zu beachten, dass nur der Wert des ersten eindeutigen Vorkommens beibehalten wird.

Beispielsweise gab es in den ersten beiden Spalten zwei Zeilen mit „East“ und „G“, aber nur der Punktwert (33) für das erste Vorkommen dieser eindeutigen Kombination wurde im endgültigen Datenrahmen beibehalten.

Ebenso gab es zwei Zeilen mit „West“ und „F“ in den ersten beiden Spalten, aber nur der Punktwert (34) für das erste Vorkommen dieser eindeutigen Kombination wurde im endgültigen Datenrahmen beibehalten.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:

So finden Sie eindeutige Werte in einer Spalte in R
So zählen Sie eindeutige Werte nach Gruppen in R
So filtern Sie eindeutige Werte mit dplyr

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert