Comment calculer la variance groupée dans R



En statistiques, la variance groupée fait référence à la moyenne de deux ou plusieurs variances de groupe.

Nous utilisons le mot « regroupé » pour indiquer que nous « regroupons » deux ou plusieurs variances de groupe pour obtenir un nombre unique pour la variance commune entre les groupes.

En pratique, la variance groupée est utilisée le plus souvent dans un test t à deux échantillons , qui est utilisé pour déterminer si les moyennes de deux populations sont égales ou non.

La variance regroupée entre deux échantillons est généralement notée sp 2 et est calculée comme suit :

s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)

Malheureusement, il n’existe pas de fonction intégrée pour calculer la variance groupée entre deux groupes dans R, mais nous pouvons la calculer assez facilement.

Par exemple, supposons que nous souhaitions calculer la variance groupée entre les deux groupes suivants :

Le code suivant montre comment calculer la variance groupée entre ces groupes dans R :

#define groups of data
x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20)
x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32)

#calculate sample size of each group
n1 <- length(x1)
n2 <- length(x2)

#calculate sample variance of each group
var1 <- var(x1)
var2 <- var(x2)

#calculate pooled variance between the two groups
pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2)

#display pooled variance
pooled

[1] 46.97143

La variance groupée entre ces deux groupes s’avère être de 46,97143 .

Ressources additionnelles

Qu’est-ce que la variance groupée ? (Définition et exemple)
Calculateur d’écart groupé
Comment calculer la variance groupée dans Excel

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *