So kombinieren sie zeilen mit gleichen spaltenwerten in r
Sie können die folgende grundlegende Syntax verwenden, um Zeilen mit denselben Spaltenwerten in einem Datenrahmen in R zu kombinieren:
library (dplyr)
df %>%
group_by(group_var1, group_var2) %>%
summarise(across(c(values_var1, values_var2), sum))
Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.
Beispiel: Zeilen mit gleichen Spaltenwerten in R kombinieren
Angenommen, wir verfügen über den folgenden Datenrahmen, der Informationen über Verkäufe und Retouren verschiedener Mitarbeiter eines Unternehmens enthält:
#create data frame df <- data. frame (id=c(101, 101, 102, 103, 103, 103), employee=c('Dan', 'Dan', 'Rick', 'Ken', 'Ken', 'Ken'), sales=c(4, 1, 3, 2, 5, 3), returns=c(1, 2, 2, 1, 3, 2)) #view data frame df id employee sales returns 1 101 Dan 4 1 2 101 Dan 1 2 3 102 Rick 3 2 4 103 Ken 2 1 5 103 Ken 5 3 6 103 Ken 3 2
Wir können die folgende Syntax verwenden, um Zeilen zu kombinieren, die in den Spalten „id“ und „ Employee “ denselben Wert haben, und dann die verbleibenden Spalten zu aggregieren:
library (dplyr) #combine rows with same value for id and employee and aggregate remaining columns df %>% group_by(id, employee) %>% summarise(across(c(sales, returns), sum)) # A tibble: 3 x 4 #Groups: id[3] id employee sales returns 1 101 Dan 5 3 2 102 Rick 3 2 3 103 Ken 10 6
Das Ergebnis ist ein Datenrahmen, der alle Zeilen im ursprünglichen Datenrahmen kombiniert, die denselben Wert in den Spalten „ID“ und „Mitarbeiter “ hatten, und dann die Summe der Werte in den Spalten „Umsätze “ und „ Retouren “ berechnet.
Hinweis : Wir entscheiden uns dafür, die Verkaufs- und Retourenspalten mit der Summenfunktion zu aggregieren, Sie können jedoch bei Bedarf auch eine andere Metrik wie den Durchschnitt aggregieren.
Verwandt: So verwenden Sie die across()-Funktion in dplyr
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in R ausführen:
So kombinieren Sie Listen in R
So kombinieren Sie zwei Vektoren in R
So kombinieren Sie zwei Datenrahmen in R mit unterschiedlichen Spalten