So aggregieren sie mehrere spalten in r (mit beispielen)


Wir können die Funktion Aggregate() in R verwenden, um zusammenfassende Statistiken für eine oder mehrere Variablen in einem Datenrahmen zu erstellen.

Diese Funktion verwendet die folgende grundlegende Syntax:

Aggregat (sum_var ~ group_var, data = df, FUN = Average)

Gold:

  • sum_var: Die zusammenzufassende Variable
  • group_var: Die zu gruppierende Variable
  • Daten: Der Name des Datenblocks
  • SPASS: Die zusammenfassende Statistik zur Berechnung

Dieses Tutorial bietet mehrere Beispiele für die Verwendung dieser Funktion zum gleichzeitigen Aggregieren einer oder mehrerer Spalten in R, wobei der folgende Datenrahmen als Beispiel dient:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C'),
                 conf=c('E', 'E', 'W', 'W', 'W', 'W', 'W', 'W'),
                 points=c(1, 3, 3, 4, 5, 7, 7, 9),
                 rebounds=c(7, 7, 8, 3, 2, 7, 14, 13))

#view data frame
df

  team conf points rebounds
1 AE 1 7
2 AE 3 7
3 AW 3 8
4 BW 4 3
5 BW 5 2
6 BW 7 7
7 CW 7 14
8 CW 9 13

Beispiel 1: Eine Variable zusammenfassen und nach einer Variablen gruppieren

Der folgende Code zeigt, wie die durchschnittlich erzielten Punkte, gruppiert nach Team, ermittelt werden:

 #find mean points scored, grouped by team
aggregate(points ~ team, data = df, FUN = mean, na. rm = TRUE )

  team points
1 A 2.333333
2 B 5.333333
3 C 8.000000

Beispiel 2: Eine Variable zusammenfassen und nach mehreren Variablen gruppieren

Der folgende Code zeigt, wie Sie die durchschnittlich erzielten Punkte ermitteln, gruppiert nach Team und Konferenz:

 #find mean points scored, grouped by team and conference
aggregate(points ~ team + conf, data = df, FUN = mean, na. rm = TRUE )

  team conf points
1 AE 2.000000
2 AW 3.000000
3 BW 5.333333
4 CW 8.000000

Beispiel 3: Mehrere Variablen zusammenfassen und nach einer Variablen gruppieren

Der folgende Code zeigt, wie Sie die Scoring-Durchschnittswerte und Rebounding-Durchschnittswerte, gruppiert nach Team, finden:

 #find mean points scored, grouped by team and conference
aggregate( cbind (points,rebounds) ~ team, data = df, FUN = mean, na. rm = TRUE )

  team points rebounds
1 A 2.333333 7.333333
2 B 5.333333 4.000000
3 C 8.000000 13.500000

Beispiel 4: Zusammenfassung mehrerer Variablen und Gruppierung nach mehreren Variablen

Der folgende Code zeigt, wie Sie die Scoring-Durchschnittswerte und Rebounding-Durchschnittswerte finden, gruppiert nach Team und Konferenz:

 #find mean points scored, grouped by team and conference
aggregate( cbind (points,rebounds) ~ team + conf, data = df, FUN = mean, na. rm = TRUE )

  team conf points rebounds
1 AE 2.000000 7.0
2AW 3.000000 8.0
3 BW 5.333333 4.0
4 CW 8.000000 13.5

Zusätzliche Ressourcen

So berechnen Sie den Durchschnitt mehrerer Spalten in R
So summieren Sie bestimmte Spalten in R
So summieren Sie bestimmte Zeilen in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert