A: so finden sie eindeutige zeilen über mehrere spalten hinweg

Von Dr. Benjamin Anderson Juli 19, 2023 Führung Keine Kommentare

Sie können die folgenden Methoden verwenden, um eindeutige Zeilen über mehrere Spalten eines Datenrahmens in R zu finden:

Methode 1: Einzigartige Zeilen über mehrere Spalten hinweg finden (andere Spalten entfernen)

 df_unique <- unique(df[c(' col1 ', ' col2 ')])

Methode 2: Einzigartige Zeilen über mehrere Spalten hinweg finden (andere Spalten beibehalten)

 df_unique <- df[!duplicated(df[c(' col1 ', ' col2 ')]),]

Die folgenden Beispiele zeigen, wie jede dieser Methoden in der Praxis mit dem folgenden Datenrahmen verwendet wird:

 #create data frame
df <- data. frame (conf=c('East', 'East', 'East', 'West', 'West', 'West'),
                 pos=c('G', 'G', 'F', 'G', 'F', 'F'),
                 dots=c(33, 28, 31, 39, 34, 40))

#view data frame
df

  conf pos points
1 East G 33
2 East G 28
3 East F 31
4 West G 39
5 West F 34
6 West F 40

Methode 1: Einzigartige Zeilen über mehrere Spalten hinweg finden (andere Spalten entfernen)

Der folgende Code zeigt, wie eindeutige Zeilen in den Spalten „conf“ und „pos“ des Datenrahmens gefunden werden:

 #find unique rows across conf and pos columns
df_unique <- unique(df[c(' conf ', ' pos ')])

#view results
df_unique 

  conf pos
1 East G
3 East
4 West G
5 West

Das Ergebnis sind vier einzigartige Linien.

Beachten Sie außerdem, dass die Punktespalte automatisch aus den Ergebnissen entfernt wurde.

Methode 2: Einzelne Zeilen über mehrere Spalten hinweg suchen (andere Spalten entfernen)

Der folgende Code zeigt, wie man einzelne Zeilen in den Spalten „conf “ und „pos“ des Datenrahmens findet und die Werte in der Spalte „points“ behält:

 #find unique rows across conf and pos columns
df_unique <- df[!duplicated(df[c(' conf ', ' pos ')]),]

#view results
df_unique 

  conf pos points
1 East G 33
3 East F 31
4 West G 39
5 West F 34

Beachten Sie, dass in den Spalten „conf “ und „pos“ nur einzelne Zeilen vorhanden sind und die Werte in der Spalte „ points“ erhalten bleiben.

Es ist wichtig zu beachten, dass nur der Wert des ersten eindeutigen Vorkommens beibehalten wird.

Beispielsweise gab es in den ersten beiden Spalten zwei Zeilen mit „East“ und „G“, aber nur der Punktwert (33) für das erste Vorkommen dieser eindeutigen Kombination wurde im endgültigen Datenrahmen beibehalten.

Ebenso gab es zwei Zeilen mit „West“ und „F“ in den ersten beiden Spalten, aber nur der Punktwert (34) für das erste Vorkommen dieser eindeutigen Kombination wurde im endgültigen Datenrahmen beibehalten.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:

So finden Sie eindeutige Werte in einer Spalte in R
So zählen Sie eindeutige Werte nach Gruppen in R
So filtern Sie eindeutige Werte mit dplyr

Über den Autor

Dr. Benjamin Anderson

Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu befähigen. Mehr wissen

Methode 1: Einzigartige Zeilen über mehrere Spalten hinweg finden (andere Spalten entfernen)

Methode 2: Einzelne Zeilen über mehrere Spalten hinweg suchen (andere Spalten entfernen)

Zusätzliche Ressourcen

Über den Autor

Dr. Benjamin Anderson

Einen Kommentar hinzufügen