Cara menghitung deviasi standar berkerumun di r
Deviasi standar gabungan hanyalah rata-rata tertimbang dari deviasi standar dua atau lebih kelompok independen.
Dalam statistik, hal ini paling sering muncul dalam uji-t dua sampel , yang digunakan untuk menguji apakah rata-rata dua populasi sama atau tidak.
Rumus untuk menghitung simpangan baku berkerumun untuk dua kelompok adalah:
Simpangan baku gabungan = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
Emas:
- n1 , n2 : Ukuran sampel masing-masing untuk kelompok 1 dan kelompok 2.
- s 1 , s 2 : Simpangan baku masing-masing untuk grup 1 dan grup 2.
Contoh berikut menunjukkan dua metode untuk menghitung deviasi standar berkerumun antara dua kelompok di R.
Metode 1: Hitung deviasi standar berkerumun secara manual
Misalkan kita memiliki nilai data berikut untuk dua sampel:
- Contoh 1 : 6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21
- Contoh 2 : 10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29
Kode berikut menunjukkan cara menghitung simpangan baku gabungan antara dua sampel ini:
#define two samples data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21) data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29) #find sample standard deviation of each sample s1 <- sd (data1) s2 < -sd (data2) #find sample size of each sample n1 <- length (data1) n2 <- length (data2) #calculate pooled standard deviation pooled <- sqrt (((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n1-2)) #view pooled standard deviation pooled [1] 5.789564
Deviasi standar yang dikumpulkan ternyata menjadi 5.789564 .
Metode 2: Hitung Deviasi Standar Tergugus Menggunakan Paket
Cara lain untuk menghitung simpangan baku gabungan antara dua sampel di R adalah dengan menggunakan fungsi sd_pooled() dari paket effectize .
Kode berikut menunjukkan cara menggunakan fungsi ini dalam praktiknya:
library (effectsize) #define two samples data1 <- c(6, 6, 7, 8, 8, 10, 11, 13, 15, 15, 16, 17, 19, 19, 21) data2 <- c(10, 11, 13, 13, 15, 17, 17, 19, 20, 22, 24, 25, 27, 29, 29) #calculate pooled standard deviation between two samples sd_pooled(data1, data2) [1] 5.789564
Deviasi standar yang dikumpulkan ternyata menjadi 5.789564 .
Perhatikan bahwa ini cocok dengan nilai yang kita hitung secara manual pada contoh sebelumnya.
Sumber daya tambahan
Tutorial berikut memberikan informasi lebih lanjut tentang menghitung deviasi standar berkerumun:
Pengantar Deviasi Standar Terkelompok
Kalkulator Deviasi Standar Berkelompok