Comment calculer la variance groupée dans R
En statistiques, la variance groupée fait référence à la moyenne de deux ou plusieurs variances de groupe.
Nous utilisons le mot « regroupé » pour indiquer que nous « regroupons » deux ou plusieurs variances de groupe pour obtenir un nombre unique pour la variance commune entre les groupes.
En pratique, la variance groupée est utilisée le plus souvent dans un test t à deux échantillons , qui est utilisé pour déterminer si les moyennes de deux populations sont égales ou non.
La variance regroupée entre deux échantillons est généralement notée sp 2 et est calculée comme suit :
s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
Malheureusement, il n’existe pas de fonction intégrée pour calculer la variance groupée entre deux groupes dans R, mais nous pouvons la calculer assez facilement.
Par exemple, supposons que nous souhaitions calculer la variance groupée entre les deux groupes suivants :
Le code suivant montre comment calculer la variance groupée entre ces groupes dans R :
#define groups of data x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20) x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32) #calculate sample size of each group n1 <- length(x1) n2 <- length(x2) #calculate sample variance of each group var1 <- var(x1) var2 <- var(x2) #calculate pooled variance between the two groups pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2) #display pooled variance pooled [1] 46.97143
La variance groupée entre ces deux groupes s’avère être de 46,97143 .
Ressources additionnelles
Qu’est-ce que la variance groupée ? (Définition et exemple)
Calculateur d’écart groupé
Comment calculer la variance groupée dans Excel