Comment calculer l’erreur standard de la moyenne dans R
L’ erreur type de la moyenne est un moyen de mesurer la répartition des valeurs dans un ensemble de données. Il est calculé comme suit :
Erreur type = s / √n
où:
- s : écart type de l’échantillon
- n : taille de l’échantillon
Ce didacticiel explique deux méthodes que vous pouvez utiliser pour calculer l’erreur type d’un ensemble de données dans R.
Méthode 1 : utiliser la bibliothèque Plotrix
La première façon de calculer l’erreur standard de la moyenne consiste à utiliser la fonction std.error() intégrée de la bibliothèque Plotrix.
Le code suivant montre comment utiliser cette fonction :
library(plotrix) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
L’erreur type de la moyenne s’avère être de 2,001447 .
Méthode 2 : définissez votre propre fonction
Une autre façon de calculer l’erreur type de la moyenne d’un ensemble de données consiste simplement à définir votre propre fonction.
Le code suivant montre comment procéder :
#define standard error of mean function std.error <- function(x) sd(x)/sqrt(length(x)) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
Encore une fois, l’erreur type de la moyenne s’avère être de 2,0014 .
Comment interpréter l’erreur type de la moyenne
L’erreur type de la moyenne est simplement une mesure de l’étalement des valeurs autour de la moyenne.
Il y a deux choses à garder à l’esprit lors de l’interprétation de l’erreur type de la moyenne :
1. Plus l’erreur type de la moyenne est grande, plus les valeurs sont dispersées autour de la moyenne dans un ensemble de données.
Pour illustrer cela, considérons si nous modifions la dernière valeur de l’ensemble de données précédent par un nombre beaucoup plus grand :
#define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150) #calculate standard error of the mean std.error(data) 6.978265
Remarquez comment l’erreur standard passe de 2,001447 à 6,978265 .
Cela indique que les valeurs de cet ensemble de données sont plus réparties autour de la moyenne par rapport à l’ensemble de données précédent.
2. À mesure que la taille de l’échantillon augmente, l’erreur type de la moyenne tend à diminuer.
Pour illustrer cela, considérons l’erreur standard de la moyenne pour les deux ensembles de données suivants :
#define first dataset and find SEM data1 <- c(1, 2, 3, 4, 5) std.error(data1) 0.7071068 #define second dataset and find SEM data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) std.error(data2) 0.4714045
Le deuxième ensemble de données est simplement le premier ensemble de données répété deux fois.
Ainsi, les deux ensembles de données ont la même moyenne mais le deuxième ensemble de données a une taille d’échantillon plus grande et a donc une erreur type plus petite.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :
Comment calculer la variance de l’échantillon et de la population dans R
Comment calculer la variance groupée dans R
Comment calculer le coefficient de variation de R