Meerdere kolommen in r samenvoegen (met voorbeelden)


We kunnen de functie Aggregate() in R gebruiken om samenvattende statistieken te produceren voor een of meer variabelen in een dataframe.

Deze functie gebruikt de volgende basissyntaxis:

aggregaat (sum_var ~ group_var, data = df, FUN = gemiddeld)

Goud:

  • sum_var: De variabele die moet worden samengevat
  • group_var: De variabele die moet worden gegroepeerd
  • data: de naam van het datablok
  • FUN: De samenvattende statistiek om te berekenen

Deze zelfstudie biedt verschillende voorbeelden van het gebruik van deze functie om een of meer kolommen tegelijk in R samen te voegen, waarbij het volgende gegevensframe als voorbeeld wordt gebruikt:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C'),
                 conf=c('E', 'E', 'W', 'W', 'W', 'W', 'W', 'W'),
                 points=c(1, 3, 3, 4, 5, 7, 7, 9),
                 rebounds=c(7, 7, 8, 3, 2, 7, 14, 13))

#view data frame
df

  team conf points rebounds
1 AE 1 7
2 AE 3 7
3 AW 3 8
4 BW 4 3
5 BW 5 2
6 BW 7 7
7 CW 7 14
8 CW 9 13

Voorbeeld 1: Een variabele samenvatten en groeperen op basis van een variabele

De volgende code laat zien hoe u de gemiddeld gescoorde punten kunt vinden, gegroepeerd per team:

 #find mean points scored, grouped by team
aggregate(points ~ team, data = df, FUN = mean, na. rm = TRUE )

  team points
1 A 2.333333
2 B 5.333333
3 C 8.000000

Voorbeeld 2: Een variabele samenvatten en groeperen op meerdere variabelen

De volgende code laat zien hoe u de gemiddeld gescoorde punten kunt vinden, gegroepeerd op team en conferentie:

 #find mean points scored, grouped by team and conference
aggregate(points ~ team + conf, data = df, FUN = mean, na. rm = TRUE )

  team conf points
1 AE 2.000000
2 AW 3.000000
3 BW 5.333333
4 CW 8.000000

Voorbeeld 3: Meerdere variabelen samenvatten en groeperen op één variabele

De volgende code laat zien hoe u de scoregemiddelden en rebound-gemiddelden kunt vinden, gegroepeerd per team:

 #find mean points scored, grouped by team and conference
aggregate( cbind (points,rebounds) ~ team, data = df, FUN = mean, na. rm = TRUE )

  team points rebounds
1 A 2.333333 7.333333
2 B 5.333333 4.000000
3 C 8.000000 13.500000

Voorbeeld 4: Meerdere variabelen samenvatten en groeperen op meerdere variabelen

De volgende code laat zien hoe u de scoregemiddelden en rebound-gemiddelden kunt vinden, gegroepeerd op team en conferentie:

 #find mean points scored, grouped by team and conference
aggregate( cbind (points,rebounds) ~ team + conf, data = df, FUN = mean, na. rm = TRUE )

  team conf points rebounds
1 AE 2.000000 7.0
2AW 3.000000 8.0
3 BW 5.333333 4.0
4 CW 8.000000 13.5

Aanvullende bronnen

Hoe het gemiddelde van meerdere kolommen in R te berekenen
Hoe specifieke kolommen in R op te tellen
Hoe specifieke rijen in R op te tellen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert