Comment calculer une moyenne tronquée dans R (avec exemples)
Une moyenne tronquée est la moyenne d’un ensemble de données qui a été calculée après avoir supprimé un pourcentage spécifique des valeurs les plus petites et les plus grandes de l’ensemble de données.
Par exemple, une moyenne tronquée de 10 % représenterait la moyenne d’un ensemble de données après la suppression des 10 % des valeurs les plus petites et des 10 % des valeurs les plus grandes.
Le moyen le plus simple de calculer une moyenne tronquée dans R consiste à utiliser la syntaxe de base suivante :
#calculate 10% trimmed mean mean(x, trim=0.1)
Les exemples suivants montrent comment utiliser cette fonction pour calculer une moyenne tronquée dans la pratique.
Exemple 1 : calculer la moyenne tronquée du vecteur
Le code suivant montre comment calculer une moyenne tronquée de 10 % pour un vecteur de données :
#define data data = c(22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12) #calculate 10% trimmed mean mean(data, trim=0.1) [1] 12.375
La moyenne tronquée à 10 % est de 12,375 .
Il s’agit de la moyenne de l’ensemble de données après que les 10 % les plus petits et les 10 % les plus grands des valeurs aient été supprimés de l’ensemble de données.
Exemple 2 : calculer la moyenne tronquée de la colonne dans le bloc de données
Le code suivant montre comment calculer une moyenne tronquée de 5 % pour une colonne spécifique dans un bloc de données :
#create data frame df = data.frame(points=c(25, 12, 15, 14, 19, 23, 25, 29), assists=c(5, 7, 7, 9, 12, 9, 9, 4), rebounds=c(11, 8, 10, 6, 6, 5, 9, 12)) #calculate 5% trimmed mean of points mean(df$points, trim=0.05) [1] 20.25
La moyenne tronquée de 5 % des valeurs de la colonne « points » est de 20,25 .
Il s’agit de la moyenne de la colonne « points » après suppression des 5 % des valeurs les plus petites et des 5 % les plus grandes.
Exemple 3 : calculer la moyenne tronquée de plusieurs colonnes
Le code suivant montre comment calculer une moyenne tronquée de 5 % pour plusieurs colonnes dans un bloc de données :
#create data frame df = data.frame(points=c(25, 12, 15, 14, 19, 23, 25, 29), assists=c(5, 7, 7, 9, 12, 9, 9, 4), rebounds=c(11, 8, 10, 6, 6, 5, 9, 12)) #calculate 5% trimmed mean of points and assists sapply(df[c('points', 'assists')], function(x) mean(x, trim=0.05)) points assists 20.25 7.75
À partir du résultat, nous pouvons voir :
- La moyenne tronquée de 5 % de la colonne « points » est de 20,25 .
- La moyenne tronquée de 5 % de la colonne « passes décisives » est de 7,75 .
Connexe : Un guide pour apply(), lapply(), sapply() et tapply() dans R
Ressources additionnelles
Les didacticiels suivants fournissent des informations supplémentaires sur les moyennes tronquées :
Comment calculer manuellement une moyenne tronquée
Comment calculer une moyenne tronquée en Python
Calculateur de moyenne tronquée