Як обчислити кластерне стандартне відхилення в r
Об’єднане стандартне відхилення – це просто зважене середнє значення стандартних відхилень двох або більше незалежних груп.
У статистиці він найчастіше з’являється у двовибірковому t-критерії , який використовується для перевірки того, чи рівні середні значення двох сукупностей.
Формула для обчислення кластерного стандартного відхилення для двох груп така:
Сукупне стандартне відхилення = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
золото:
- n1 , n2 : розмір вибірки для групи 1 і групи 2 відповідно.
- s 1 , s 2 : стандартне відхилення для групи 1 і групи 2 відповідно.
У наведених нижче прикладах показано два методи обчислення кластерного стандартного відхилення між двома групами в R.
Спосіб 1: обчислення кластерного стандартного відхилення вручну
Припустимо, у нас є такі значення даних для двох зразків:
- Зразок 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21
- Зразок 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29
У наступному коді показано, як обчислити об’єднане стандартне відхилення між цими двома зразками:
#define two samples data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21) data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29) #find sample standard deviation of each sample s1 <- sd (data1) s2 < -sd (data2) #find sample size of each sample n1 <- length (data1) n2 <- length (data2) #calculate pooled standard deviation pooled <- sqrt (((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2)) #view pooled standard deviation pooled [1] 5.789564
Зведене стандартне відхилення виявляється рівним 5,789564 .
Спосіб 2: обчисліть кластеризоване стандартне відхилення за допомогою пакета
Інший спосіб обчислення об’єднаного стандартного відхилення між двома вибірками в R – це використання функції sd_pooled() із пакета effectize .
Наступний код показує, як використовувати цю функцію на практиці:
library (effectsize) #define two samples data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21) data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29) #calculate pooled standard deviation between two samples sd_pooled(data1, data2) [1] 5.789564
Сукупне стандартне відхилення виявляється рівним 5,789564 .
Зауважте, що це відповідає значенню, яке ми обчислили вручну в попередньому прикладі.
Додаткові ресурси
У наступних посібниках надається додаткова інформація про обчислення кластерного стандартного відхилення:
Вступ до кластерного стандартного відхилення
Кластеризований калькулятор стандартного відхилення