Como calcular o desvio padrão agrupado em r


Um desvio padrão combinado é simplesmente uma média ponderada dos desvios padrão de dois ou mais grupos independentes.

Nas estatísticas, aparece mais comumente no teste t de duas amostras , que é usado para testar se as médias de duas populações são iguais ou não.

A fórmula para calcular um desvio padrão agrupado para dois grupos é:

Desvio padrão combinado = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

Ouro:

  • n1 , n2 : Tamanho da amostra para grupo 1 e grupo 2, respectivamente.
  • s 1 , s 2 : Desvio padrão para grupo 1 e grupo 2, respectivamente.

Os exemplos a seguir mostram dois métodos para calcular um desvio padrão agrupado entre dois grupos em R.

Método 1: calcular manualmente o desvio padrão agrupado

Suponha que temos os seguintes valores de dados para duas amostras:

  • Amostra 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21
  • Amostra 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29

O código a seguir mostra como calcular o desvio padrão agrupado entre essas duas amostras:

 #define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#find sample standard deviation of each sample
s1 <- sd (data1)
s2 < -sd (data2)

#find sample size of each sample
n1 <- length (data1)
n2 <- length (data2)

#calculate pooled standard deviation
pooled <- sqrt (((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2))

#view pooled standard deviation
pooled

[1] 5.789564

O desvio padrão combinado é 5,789564 .

Método 2: calcular o desvio padrão agrupado usando um pacote

Outra maneira de calcular o desvio padrão agrupado entre duas amostras em R é usar a função sd_pooled() do pacote effectize .

O código a seguir mostra como usar esta função na prática:

 library (effectsize)

#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#calculate pooled standard deviation between two samples
sd_pooled(data1, data2)

[1] 5.789564

O desvio padrão combinado é 5,789564 .

Observe que isso corresponde ao valor que calculamos manualmente no exemplo anterior.

Recursos adicionais

Os tutoriais a seguir fornecem mais informações sobre como calcular um desvio padrão agrupado:

Uma introdução ao desvio padrão agrupado
Calculadora de desvio padrão agrupado

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *