Comment calculer l’erreur standard de la moyenne dans R

Par Dr. Benjamin Anderson juillet 27, 2023 Guide 0 commentaire

L’ erreur type de la moyenne est un moyen de mesurer la répartition des valeurs dans un ensemble de données. Il est calculé comme suit :

Erreur type = s / √n

où:

s : écart type de l’échantillon
n : taille de l’échantillon

Ce didacticiel explique deux méthodes que vous pouvez utiliser pour calculer l’erreur type d’un ensemble de données dans R.

Méthode 1 : utiliser la bibliothèque Plotrix

La première façon de calculer l’erreur standard de la moyenne consiste à utiliser la fonction std.error() intégrée de la bibliothèque Plotrix.

Le code suivant montre comment utiliser cette fonction :

library(plotrix)

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

L’erreur type de la moyenne s’avère être de 2,001447 .

Méthode 2 : définissez votre propre fonction

Une autre façon de calculer l’erreur type de la moyenne d’un ensemble de données consiste simplement à définir votre propre fonction.

Le code suivant montre comment procéder :

#define standard error of mean function
std.error <- function(x) sd(x)/sqrt(length(x))

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

Encore une fois, l’erreur type de la moyenne s’avère être de 2,0014 .

Comment interpréter l’erreur type de la moyenne

L’erreur type de la moyenne est simplement une mesure de l’étalement des valeurs autour de la moyenne.

Il y a deux choses à garder à l’esprit lors de l’interprétation de l’erreur type de la moyenne :

1. Plus l’erreur type de la moyenne est grande, plus les valeurs sont dispersées autour de la moyenne dans un ensemble de données.

Pour illustrer cela, considérons si nous modifions la dernière valeur de l’ensemble de données précédent par un nombre beaucoup plus grand :

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150)

#calculate standard error of the mean 
std.error(data)

6.978265

Remarquez comment l’erreur standard passe de 2,001447 à 6,978265 .

Cela indique que les valeurs de cet ensemble de données sont plus réparties autour de la moyenne par rapport à l’ensemble de données précédent.

2. À mesure que la taille de l’échantillon augmente, l’erreur type de la moyenne tend à diminuer.

Pour illustrer cela, considérons l’erreur standard de la moyenne pour les deux ensembles de données suivants :

#define first dataset and find SEM
data1 <- c(1, 2, 3, 4, 5)
std.error(data1)

0.7071068

#define second dataset and find SEM
data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5)
std.error(data2)

0.4714045

Le deuxième ensemble de données est simplement le premier ensemble de données répété deux fois.

Ainsi, les deux ensembles de données ont la même moyenne mais le deuxième ensemble de données a une taille d’échantillon plus grande et a donc une erreur type plus petite.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Comment calculer la variance de l’échantillon et de la population dans R
Comment calculer la variance groupée dans R
Comment calculer le coefficient de variation de R

à propos de l'auteur

Dr. Benjamin Anderson

Il est un professeur de statistiques à la retraite devenu éducateur dévoué sur Statorials. Avec une vaste expérience et une expertise dans le domaine des statistiques, je m'engage à partager mes connaissances pour responsabiliser les étudiants grâce à Statorials. Lire plus