Le guide complet : comment utiliser la fonction Aggregate() dans R
La fonction Aggregate() dans R peut être utilisée pour calculer des statistiques récapitulatives pour un ensemble de données.
Cette fonction utilise la syntaxe de base suivante :
agrégat(x, par, FUN)
où:
- x : Une variable à agréger
- by : Une liste de variables à regrouper par
- FUN : La statistique récapitulative à calculer
Les exemples suivants montrent comment utiliser cette fonction en pratique avec le bloc de données suivant dans R :
#create data frame df <- data.frame(team=c('A', 'A', 'A', 'B', 'B', 'B'), position=c('G', 'G', 'F', 'G', 'F', 'F'), points=c(99, 90, 86, 88, 95, 99), assists=c(33, 28, 31, 39, 34, 23), rebounds=c(30, 28, 24, 24, 28, 33)) #view data frame df team position points assists rebounds 1 A G 99 33 30 2 A G 90 28 28 3 A F 86 31 24 4 B G 88 39 24 5 B F 95 34 28 6 B F 99 23 33
Exemple 1 : Moyenne globale par groupe
Le code suivant montre comment utiliser la fonction Aggregate() pour calculer le nombre moyen de points marqués par équipe :
#find mean points by team
aggregate(df$points, by=list(df$team), FUN=mean)
Group.1 x
1 A 91.66667
2 B 94.00000
Cela nous dit :
- Les joueurs de l’équipe A ont marqué en moyenne 91,67 points par match.
- Les joueurs de l’équipe B ont marqué en moyenne 94 points par match.
Notez que vous pouvez également modifier les noms des colonnes dans la sortie en utilisant la fonction colnames() :
#find mean points by team agg <- aggregate(df$points, by=list(df$team), FUN=mean) #rename columns in output colnames(agg) <- c('Team', 'Mean_Points') #view output agg Team Mean_Points 1 A 91.66667 2 B 94.00000
Exemple 2 : Compte agrégé par groupe
Le code suivant montre comment utiliser la fonction Aggregate() pour compter le nombre de joueurs par équipe :
#count number of players by team
aggregate(df$points, by=list(df$team), FUN=length)
Group.1 x
1 A 3
2 B 3
Cela nous dit :
- L’équipe A est composée de 3 joueurs.
- L’équipe B est composée de 3 joueurs.
Exemple 3 : Somme globale par groupe
Le code suivant montre comment utiliser la fonction Aggregate() pour calculer la somme des points marqués par chaque équipe :
#find sum of points scored by team
aggregate(df$points, by=list(df$team), FUN=sum)
Group.1 x
1 A 275
2 B 282
Cela nous dit :
- L’équipe A a marqué un total de 275 points.
- L’équipe B a marqué un total de 282 points.
Exemple 4 : Agréger plusieurs colonnes
Le code suivant montre comment utiliser la fonction Aggregate() pour trouver le nombre moyen de points marqués, regroupés par équipe et position :
#find mean of points scored, grouped by team and position
aggregate(df$points, by=list(df$team, df$position), FUN=mean)
Group.1 Group.2 x
1 A F 86.0
2 B F 97.0
3 A G 94.5
4 B G 88.0
Cela nous dit :
- Les joueurs en position « F » de l’équipe A ont marqué en moyenne 86 points.
- Les joueurs en position « F » de l’équipe B ont marqué en moyenne 97 points.
- Les joueurs en position « G » de l’équipe A ont marqué en moyenne 94,5 points.
- Les joueurs en position « G » de l’équipe B ont marqué en moyenne 88 points.
Ressources additionnelles
Les didacticiels suivants expliquent comment utiliser d’autres fonctions courantes dans R :
Comment utiliser la fonction table() dans R
Comment utiliser la fonction gsub() dans R
Comment utiliser la fonction summary() dans R