Le guide complet : comment utiliser la fonction Aggregate() dans R



La fonction Aggregate() dans R peut être utilisée pour calculer des statistiques récapitulatives pour un ensemble de données.

Cette fonction utilise la syntaxe de base suivante :

agrégat(x, par, FUN)

où:

  • x : Une variable à agréger
  • by : Une liste de variables à regrouper par
  • FUN : La statistique récapitulative à calculer

Les exemples suivants montrent comment utiliser cette fonction en pratique avec le bloc de données suivant dans R :

#create data frame
df <- data.frame(team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 position=c('G', 'G', 'F', 'G', 'F', 'F'),
                 points=c(99, 90, 86, 88, 95, 99),
                 assists=c(33, 28, 31, 39, 34, 23),
                 rebounds=c(30, 28, 24, 24, 28, 33))

#view data frame
df

  team position points assists rebounds
1    A        G     99      33       30
2    A        G     90      28       28
3    A        F     86      31       24
4    B        G     88      39       24
5    B        F     95      34       28
6    B        F     99      23       33

Exemple 1 : Moyenne globale par groupe

Le code suivant montre comment utiliser la fonction Aggregate() pour calculer le nombre moyen de points marqués par équipe :

#find mean points by team
aggregate(df$points, by=list(df$team), FUN=mean)

  Group.1        x
1       A 91.66667
2       B 94.00000

Cela nous dit :

  • Les joueurs de l’équipe A ont marqué en moyenne 91,67 points par match.
  • Les joueurs de l’équipe B ont marqué en moyenne 94 points par match.

Notez que vous pouvez également modifier les noms des colonnes dans la sortie en utilisant la fonction colnames() :

#find mean points by team
agg <- aggregate(df$points, by=list(df$team), FUN=mean)

#rename columns in output
colnames(agg) <- c('Team', 'Mean_Points')

#view output
agg

  Team Mean_Points
1    A    91.66667
2    B    94.00000

Exemple 2 : Compte agrégé par groupe

Le code suivant montre comment utiliser la fonction Aggregate() pour compter le nombre de joueurs par équipe :

#count number of players by team
aggregate(df$points, by=list(df$team), FUN=length)

  Group.1 x
1       A 3
2       B 3

Cela nous dit :

  • L’équipe A est composée de 3 joueurs.
  • L’équipe B est composée de 3 joueurs.

Exemple 3 : Somme globale par groupe

Le code suivant montre comment utiliser la fonction Aggregate() pour calculer la somme des points marqués par chaque équipe :

#find sum of points scored by team
aggregate(df$points, by=list(df$team), FUN=sum)

  Group.1   x
1       A 275
2       B 282

Cela nous dit :

  • L’équipe A a marqué un total de 275 points.
  • L’équipe B a marqué un total de 282 points.

Exemple 4 : Agréger plusieurs colonnes

Le code suivant montre comment utiliser la fonction Aggregate() pour trouver le nombre moyen de points marqués, regroupés par équipe et position :

#find mean of points scored, grouped by team and position
aggregate(df$points, by=list(df$team, df$position), FUN=mean)

  Group.1 Group.2    x
1       A       F 86.0
2       B       F 97.0
3       A       G 94.5
4       B       G 88.0

Cela nous dit :

  • Les joueurs en position « F » de l’équipe A ont marqué en moyenne 86 points.
  • Les joueurs en position « F » de l’équipe B ont marqué en moyenne 97 points.
  • Les joueurs en position « G » de l’équipe A ont marqué en moyenne 94,5 points.
  • Les joueurs en position « G » de l’équipe B ont marqué en moyenne 88 points.

Ressources additionnelles

Les didacticiels suivants expliquent comment utiliser d’autres fonctions courantes dans R :

Comment utiliser la fonction table() dans R
Comment utiliser la fonction gsub() dans R
Comment utiliser la fonction summary() dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *