Comment calculer une moyenne tronquée dans R (avec exemples)



Une moyenne tronquée est la moyenne d’un ensemble de données qui a été calculée après avoir supprimé un pourcentage spécifique des valeurs les plus petites et les plus grandes de l’ensemble de données.

Par exemple, une moyenne tronquée de 10 % représenterait la moyenne d’un ensemble de données après la suppression des 10 % des valeurs les plus petites et des 10 % des valeurs les plus grandes.

Le moyen le plus simple de calculer une moyenne tronquée dans R consiste à utiliser la syntaxe de base suivante :

#calculate 10% trimmed mean
mean(x, trim=0.1)

Les exemples suivants montrent comment utiliser cette fonction pour calculer une moyenne tronquée dans la pratique.

Exemple 1 : calculer la moyenne tronquée du vecteur

Le code suivant montre comment calculer une moyenne tronquée de 10 % pour un vecteur de données :

#define data
data = c(22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12)

#calculate 10% trimmed mean
mean(data, trim=0.1)

[1] 12.375

La moyenne tronquée à 10 % est de 12,375 .

Il s’agit de la moyenne de l’ensemble de données après que les 10 % les plus petits et les 10 % les plus grands des valeurs aient été supprimés de l’ensemble de données.

Exemple 2 : calculer la moyenne tronquée de la colonne dans le bloc de données

Le code suivant montre comment calculer une moyenne tronquée de 5 % pour une colonne spécifique dans un bloc de données :

#create data frame
df = data.frame(points=c(25, 12, 15, 14, 19, 23, 25, 29),
                assists=c(5, 7, 7, 9, 12, 9, 9, 4),
                rebounds=c(11, 8, 10, 6, 6, 5, 9, 12))

#calculate 5% trimmed mean of points
mean(df$points, trim=0.05)

[1] 20.25

La moyenne tronquée de 5 % des valeurs de la colonne « points » est de 20,25 .

Il s’agit de la moyenne de la colonne « points » après suppression des 5 % des valeurs les plus petites et des 5 % les plus grandes.

Exemple 3 : calculer la moyenne tronquée de plusieurs colonnes

Le code suivant montre comment calculer une moyenne tronquée de 5 % pour plusieurs colonnes dans un bloc de données :

#create data frame
df = data.frame(points=c(25, 12, 15, 14, 19, 23, 25, 29),
                assists=c(5, 7, 7, 9, 12, 9, 9, 4),
                rebounds=c(11, 8, 10, 6, 6, 5, 9, 12))

#calculate 5% trimmed mean of points and assists
sapply(df[c('points', 'assists')], function(x) mean(x, trim=0.05))

 points assists 
  20.25    7.75 

À partir du résultat, nous pouvons voir :

  • La moyenne tronquée de 5 % de la colonne « points » est de 20,25 .
  • La moyenne tronquée de 5 % de la colonne « passes décisives » est de 7,75 .

Connexe : Un guide pour apply(), lapply(), sapply() et tapply() dans R

Ressources additionnelles

Les didacticiels suivants fournissent des informations supplémentaires sur les moyennes tronquées :

Comment calculer manuellement une moyenne tronquée
Comment calculer une moyenne tronquée en Python
Calculateur de moyenne tronquée

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *