Jak obliczyć skupione odchylenie standardowe w r
Łączne odchylenie standardowe to po prostu średnia ważona odchyleń standardowych dwóch lub więcej niezależnych grup.
W statystyce najczęściej pojawia się w teście t dla dwóch prób , który służy do sprawdzenia, czy średnie z dwóch populacji są równe.
Wzór na obliczenie skupionego odchylenia standardowego dla dwóch grup jest następujący:
Połączone odchylenie standardowe = √ (n 1 -1) s 1 2 + (n 2 -1) s 2 2 / (n 1 + n 2 -2)
Złoto:
- n1 , n2 : Wielkość próby odpowiednio dla grupy 1 i grupy 2.
- s 1 , s 2 : Odchylenie standardowe odpowiednio dla grupy 1 i grupy 2.
Poniższe przykłady pokazują dwie metody obliczania skupionego odchylenia standardowego między dwiema grupami w R.
Metoda 1: Ręcznie oblicz skupione odchylenie standardowe
Załóżmy, że mamy następujące wartości danych dla dwóch próbek:
- Próbka 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21
- Próbka 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29
Poniższy kod pokazuje, jak obliczyć zbiorcze odchylenie standardowe między tymi dwiema próbami:
#define two samples data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21) data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29) #find sample standard deviation of each sample s1 <- sd (data1) s2 < -sd (data2) #find sample size of each sample n1 <- length (data1) n2 <- length (data2) #calculate pooled standard deviation pooled <- sqrt (((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2)) #view pooled standard deviation pooled [1] 5.789564
Łączne odchylenie standardowe wynosi 5,789564 .
Metoda 2: Oblicz skupione odchylenie standardowe za pomocą pakietu
Innym sposobem obliczenia zbiorczego odchylenia standardowego między dwiema próbkami w R jest użycie funkcji sd_pooled() z pakietu Effectize .
Poniższy kod pokazuje, jak w praktyce wykorzystać tę funkcję:
library (effectsize) #define two samples data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21) data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29) #calculate pooled standard deviation between two samples sd_pooled(data1, data2) [1] 5.789564
Łączne odchylenie standardowe wynosi 5,789564 .
Należy pamiętać, że odpowiada to wartości obliczonej ręcznie w poprzednim przykładzie.
Dodatkowe zasoby
Poniższe samouczki zawierają więcej informacji na temat obliczania skupionego odchylenia standardowego:
Wprowadzenie do skupionego odchylenia standardowego
Skupiony kalkulator odchylenia standardowego