Comment calculer la moyenne conditionnelle dans R (avec des exemples)



Vous pouvez utiliser la syntaxe suivante pour calculer une moyenne conditionnelle dans R :

mean(df[df$team == 'A', 'points'])

Ceci calcule la moyenne de la colonne « points » pour chaque ligne du bloc de données où la colonne « équipe » est égale à « A ».

Les exemples suivants montrent comment utiliser cette syntaxe en pratique avec le bloc de données suivant :

#create data frame
df <- data.frame(team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 points=c(99, 90, 93, 86, 88, 82),
                 assists=c(33, 28, 31, 39, 34, 30))

#view data frame
df

  team points assists
1    A     99      33
2    A     90      28
3    A     93      31
4    B     86      39
5    B     88      34
6    B     82      30

Exemple 1 : calculer la moyenne conditionnelle pour une variable catégorielle

Le code suivant montre comment calculer la moyenne de la colonne « points » uniquement pour les lignes du bloc de données où la colonne « équipe » a la valeur « A ».

#calculate mean of 'points' column for rows where team equals 'A'
mean(df[df$team == 'A', 'points'])

[1] 94

La valeur moyenne dans la colonne « points » pour les lignes où « équipe » est égale à « A » est de 94 .

Nous pouvons le vérifier manuellement en calculant la moyenne des valeurs de points uniquement pour les lignes où « équipe » est égale à « A » :

  • Moyenne des points : (99 + 90 + 93) / 3 = 94

Exemple 2 : calculer la moyenne conditionnelle pour une variable numérique

Le code suivant montre comment calculer la moyenne de la colonne « assistances » uniquement pour les lignes du bloc de données où la colonne « points » a une valeur supérieure ou égale à 90.

#calculate mean of 'assists' column for rows where 'points' >= 90
mean(df[df$points >= 90, 'assists'])

[1] 30.66667

La valeur moyenne dans la colonne « passes décisives » pour les lignes où les « points » sont supérieurs ou égaux à 90 est 30,66667 .

Nous pouvons le vérifier manuellement en calculant la moyenne des valeurs d’assistance uniquement pour les lignes où les points sont supérieurs ou égaux à 90 :

  • Moyenne des passes décisives : (33 + 28 + 31) / 3 = 30,66667

Ressources additionnelles

Les tutoriels suivants expliquent comment calculer d’autres valeurs moyennes dans R :

Comment calculer une moyenne tronquée dans R
Comment calculer la moyenne géométrique dans R
Comment calculer une moyenne pondérée dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *