Comment calculer l’écart type groupé dans R



Un écart type regroupé est simplement une moyenne pondérée des écarts types de deux ou plusieurs groupes indépendants.

En statistiques, il apparaît le plus souvent dans le test t à deux échantillons , qui est utilisé pour tester si les moyennes de deux populations sont égales ou non.

La formule pour calculer un écart type groupé pour deux groupes est la suivante :

Écart type groupé = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

où:

  • n 1 , n 2 : Taille de l’échantillon pour le groupe 1 et le groupe 2, respectivement.
  • s 1 , s 2 : Ecart type pour le groupe 1 et le groupe 2, respectivement.

Les exemples suivants montrent deux méthodes pour calculer un écart type regroupé entre deux groupes dans R.

Méthode 1 : calculer manuellement l’écart type groupé

Supposons que nous ayons les valeurs de données suivantes pour deux échantillons :

  • Échantillon 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21
  • Échantillon 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29

Le code suivant montre comment calculer l’écart type regroupé entre ces deux échantillons :

#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#find sample standard deviation of each sample
s1 <- sd(data1)
s2 <- sd(data2)

#find sample size of each sample
n1 <- length(data1)
n2 <- length(data2)

#calculate pooled standard deviation
pooled <- sqrt(((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2))

#view pooled standard deviation
pooled

[1] 5.789564

L’écart type groupé s’avère être de 5,789564 .

Méthode 2 : calculer l’écart type groupé à l’aide d’un package

Une autre façon de calculer l’écart type regroupé entre deux échantillons dans R consiste à utiliser la fonction sd_pooled() du package effectize .

Le code suivant montre comment utiliser cette fonction en pratique :

library(effectsize)

#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#calculate pooled standard deviation between two samples
sd_pooled(data1, data2)

[1] 5.789564

L’écart type groupé s’avère être de 5,789564 .

Notez que cela correspond à la valeur que nous avons calculée manuellement dans l’exemple précédent.

Ressources additionnelles

Les didacticiels suivants fournissent plus d’informations sur le calcul d’un écart type groupé :

Une introduction à l’écart type groupé
Calculateur d’écart type groupé

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *