So verwenden sie ungroup() in dplyr (mit beispielen)
Sie können die Funktion ungroup() in dplyr verwenden, um die Gruppierung von Zeilen aufzuheben, nachdem Sie die Funktion group_by() verwendet haben, um eine Variable pro Gruppe zusammenzufassen.
Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis nutzen können.
Beispiel: So verwenden Sie ungroup() in dplyr
Angenommen, wir haben den folgenden Datenrahmen in R:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
dots=c(14, 18, 22, 26, 36, 34),
assists=c(5, 4, 4, 8, 7, 3))
#view data frame
df
team points assists
1 to 14 5
2 to 18 4
3 to 22 4
4 B 26 8
5 B 36 7
6 B 34 3
Nehmen wir nun an, wir verwenden den folgenden Code, um den durchschnittlichen Punktwert , gruppiert nach Team , zu berechnen:
library (dplyr)
#calculate mean of points, grouped by team
df_new <- df %>%
group_by(team) %>%
summarize(mean_points = mean(points)) %>%
A group()
#view results
df_new
# A tibble: 2 x 2
team mean_points
1 to 18
2 B 32
Mit dieser Syntax können wir den Durchschnittswert der nach Team gruppierten Punkte berechnen, aber wir haben die Assists- Spalte verloren.
Um die Spalte „Helper“ beizubehalten, können wir mutate() anstelle von summary() verwenden und am Ende trotzdem ungroup() verwenden:
library (dplyr)
#calculate mean of points, grouped by team
df_new <- df %>%
group_by(team) %>%
mutate(mean_points = mean(points)) %>%
A group()
#view results
df_new
# A tibble: 6 x 4
team points assists mean_points
1 A 14 5 18
2 A 18 4 18
3 A 22 4 18
4 B 26 8 32
5 B 36 7 32
6 B 34 3 32
Diesmal können wir die Spalte „Assists“ beibehalten und mit der Funktion mutate() einfach eine neue Spalte namens „ Mean_points“ hinzugefügt haben, die den durchschnittlichen Punktwert für jedes Team anzeigt.
Da wir auch die Funktion ungroup() verwendet haben, können wir Berechnungen für diesen neuen Datenrahmen durchführen, ohne uns Gedanken über Berechnungen machen zu müssen, die von gruppierten Variablen beeinflusst werden.
Wenn wir die Funktion ungroup() nicht verwenden würden, würden die Zeilen im Datenrahmen immer noch gruppiert, was unbeabsichtigte Folgen haben könnte, wenn wir später andere Berechnungen durchführen.
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in R ausführen:
So filtern Sie eindeutige Werte mit dplyr
So filtern Sie mit dplyr nach mehreren Bedingungen
So zählen Sie die Anzahl der Vorkommen in Spalten in R