Как рассчитать кластерное стандартное отклонение в r


Объединенное стандартное отклонение — это просто средневзвешенное значение стандартных отклонений двух или более независимых групп.

В статистике он чаще всего появляется в двухвыборочном t-тесте , который используется для проверки того, равны ли средние значения двух совокупностей.

Формула расчета кластерного стандартного отклонения для двух групп:

Объединенное стандартное отклонение = √ (n 1 -1) с 1 2 + (n 2 -1) с 2 2 / (n 1 +n 2 -2)

Золото:

  • n1 , n2 : размер выборки для группы 1 и группы 2 соответственно.
  • s 1 , s 2 : Стандартное отклонение для группы 1 и группы 2 соответственно.

В следующих примерах показаны два метода расчета кластерного стандартного отклонения между двумя группами в R.

Метод 1: вручную вычислить кластерное стандартное отклонение.

Предположим, у нас есть следующие значения данных для двух выборок:

  • Образец 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21.
  • Образец 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29.

Следующий код показывает, как вычислить объединенное стандартное отклонение между этими двумя выборками:

 #define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#find sample standard deviation of each sample
s1 <- sd (data1)
s2 < -sd (data2)

#find sample size of each sample
n1 <- length (data1)
n2 <- length (data2)

#calculate pooled standard deviation
pooled <- sqrt (((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2))

#view pooled standard deviation
pooled

[1] 5.789564

Объединенное стандартное отклонение оказывается равным 5,789564 .

Метод 2: вычисление кластерного стандартного отклонения с использованием пакета

Другой способ вычислить объединенное стандартное отклонение между двумя выборками в R — использовать функцию sd_pooled() из пакета effectize .

Следующий код показывает, как использовать эту функцию на практике:

 library (effectsize)

#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#calculate pooled standard deviation between two samples
sd_pooled(data1, data2)

[1] 5.789564

Объединенное стандартное отклонение оказывается равным 5,789564 .

Обратите внимание, что это соответствует значению, которое мы вычислили вручную в предыдущем примере.

Дополнительные ресурсы

Следующие учебные пособия предоставляют дополнительную информацию о вычислении кластерного стандартного отклонения:

Введение в кластерное стандартное отклонение
Калькулятор кластерного стандартного отклонения

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *