Як обчислити кластерне стандартне відхилення в r

за Редакція 23 Липня, 2023 Гід 0 коментарів

Об’єднане стандартне відхилення – це просто зважене середнє значення стандартних відхилень двох або більше незалежних груп.

У статистиці він найчастіше з’являється у двовибірковому t-критерії , який використовується для перевірки того, чи рівні середні значення двох сукупностей.

Формула для обчислення кластерного стандартного відхилення для двох груп така:

Сукупне стандартне відхилення = √ (n ₁ -1)s ₁ ² + (n ₂ -1)s ₂ ² / (n ₁ +n ₂ -2)

золото:

_n1 , _n2 : розмір вибірки для групи 1 і групи 2 відповідно.
s ₁ , s ₂ : стандартне відхилення для групи 1 і групи 2 відповідно.

У наведених нижче прикладах показано два методи обчислення кластерного стандартного відхилення між двома групами в R.

Спосіб 1: обчислення кластерного стандартного відхилення вручну

Припустимо, у нас є такі значення даних для двох зразків:

Зразок 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21
Зразок 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29

У наступному коді показано, як обчислити об’єднане стандартне відхилення між цими двома зразками:

 #define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#find sample standard deviation of each sample
s1 <- sd (data1)
s2 < -sd (data2)

#find sample size of each sample
n1 <- length (data1)
n2 <- length (data2)

#calculate pooled standard deviation
pooled <- sqrt (((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2))

#view pooled standard deviation
pooled

[1] 5.789564

Зведене стандартне відхилення виявляється рівним 5,789564 .

Спосіб 2: обчисліть кластеризоване стандартне відхилення за допомогою пакета

Інший спосіб обчислення об’єднаного стандартного відхилення між двома вибірками в R – це використання функції sd_pooled() із пакета effectize .

Наступний код показує, як використовувати цю функцію на практиці:

 library (effectsize)

#define two samples
data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21)
data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29)

#calculate pooled standard deviation between two samples
sd_pooled(data1, data2)

[1] 5.789564

Сукупне стандартне відхилення виявляється рівним 5,789564 .

Зауважте, що це відповідає значенню, яке ми обчислили вручну в попередньому прикладі.

Додаткові ресурси

У наступних посібниках надається додаткова інформація про обчислення кластерного стандартного відхилення:

Вступ до кластерного стандартного відхилення
Кластеризований калькулятор стандартного відхилення

Про автора

Редакція

Привіт, я Бенджамін, професор статистики на пенсії, який став викладачем статистики. Маючи великий досвід і знання в галузі статистики, я готовий поділитися своїми знаннями, щоб розширити можливості студентів через Statorials. Дізнайтеся більше

Спосіб 1: обчислення кластерного стандартного відхилення вручну

Спосіб 2: обчисліть кластеризоване стандартне відхилення за допомогою пакета

Додаткові ресурси

Про автора

Редакція

Додати коментар