So aggregieren sie mehrere spalten in r (mit beispielen)
Wir können die Funktion Aggregate() in R verwenden, um zusammenfassende Statistiken für eine oder mehrere Variablen in einem Datenrahmen zu erstellen.
Diese Funktion verwendet die folgende grundlegende Syntax:
Aggregat (sum_var ~ group_var, data = df, FUN = Average)
Gold:
- sum_var: Die zusammenzufassende Variable
- group_var: Die zu gruppierende Variable
- Daten: Der Name des Datenblocks
- SPASS: Die zusammenfassende Statistik zur Berechnung
Dieses Tutorial bietet mehrere Beispiele für die Verwendung dieser Funktion zum gleichzeitigen Aggregieren einer oder mehrerer Spalten in R, wobei der folgende Datenrahmen als Beispiel dient:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C'), conf=c('E', 'E', 'W', 'W', 'W', 'W', 'W', 'W'), points=c(1, 3, 3, 4, 5, 7, 7, 9), rebounds=c(7, 7, 8, 3, 2, 7, 14, 13)) #view data frame df team conf points rebounds 1 AE 1 7 2 AE 3 7 3 AW 3 8 4 BW 4 3 5 BW 5 2 6 BW 7 7 7 CW 7 14 8 CW 9 13
Beispiel 1: Eine Variable zusammenfassen und nach einer Variablen gruppieren
Der folgende Code zeigt, wie die durchschnittlich erzielten Punkte, gruppiert nach Team, ermittelt werden:
#find mean points scored, grouped by team aggregate(points ~ team, data = df, FUN = mean, na. rm = TRUE ) team points 1 A 2.333333 2 B 5.333333 3 C 8.000000
Beispiel 2: Eine Variable zusammenfassen und nach mehreren Variablen gruppieren
Der folgende Code zeigt, wie Sie die durchschnittlich erzielten Punkte ermitteln, gruppiert nach Team und Konferenz:
#find mean points scored, grouped by team and conference aggregate(points ~ team + conf, data = df, FUN = mean, na. rm = TRUE ) team conf points 1 AE 2.000000 2 AW 3.000000 3 BW 5.333333 4 CW 8.000000
Beispiel 3: Mehrere Variablen zusammenfassen und nach einer Variablen gruppieren
Der folgende Code zeigt, wie Sie die Scoring-Durchschnittswerte und Rebounding-Durchschnittswerte, gruppiert nach Team, finden:
#find mean points scored, grouped by team and conference aggregate( cbind (points,rebounds) ~ team, data = df, FUN = mean, na. rm = TRUE ) team points rebounds 1 A 2.333333 7.333333 2 B 5.333333 4.000000 3 C 8.000000 13.500000
Beispiel 4: Zusammenfassung mehrerer Variablen und Gruppierung nach mehreren Variablen
Der folgende Code zeigt, wie Sie die Scoring-Durchschnittswerte und Rebounding-Durchschnittswerte finden, gruppiert nach Team und Konferenz:
#find mean points scored, grouped by team and conference aggregate( cbind (points,rebounds) ~ team + conf, data = df, FUN = mean, na. rm = TRUE ) team conf points rebounds 1 AE 2.000000 7.0 2AW 3.000000 8.0 3 BW 5.333333 4.0 4 CW 8.000000 13.5
Zusätzliche Ressourcen
So berechnen Sie den Durchschnitt mehrerer Spalten in R
So summieren Sie bestimmte Spalten in R
So summieren Sie bestimmte Zeilen in R