Cara menghitung varians gabungan di r
Dalam statistik, varian klaster mengacu pada rata-rata dari dua atau lebih varian klaster.
Kita menggunakan kata “dikumpulkan” untuk menunjukkan bahwa kita “menggabungkan” dua atau lebih varian kelompok untuk mendapatkan satu angka untuk varian umum antar kelompok.
Dalam praktiknya, varians yang dikumpulkan paling sering digunakan dalam uji-t dua sampel , yang digunakan untuk menentukan apakah rata-rata dua populasi sama atau tidak.
Varians yang dikumpulkan antara dua sampel umumnya dilambangkan sp 2 dan dihitung sebagai berikut:
s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
Sayangnya, tidak ada fungsi bawaan untuk menghitung varians gabungan antara dua grup di R, namun kita dapat menghitungnya dengan cukup mudah.
Misalnya, kita ingin menghitung varians gabungan antara dua kelompok berikut:
Kode berikut menunjukkan cara menghitung varians gabungan antara grup-grup ini di R:
#define groups of data x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20) x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32) #calculate sample size of each group n1 <- length(x1) n2 <- length(x2) #calculate sample variance of each group var1 <- var(x1) var2 <- var(x2) #calculate pooled variance between the two groups pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2) #display pooled variance pooled [1] 46.97143
Varians yang dikumpulkan antara kedua kelompok ini adalah 46.97143 .
Sumber daya tambahan
Apa itu varians berkerumun? (Definisi dan contoh)
Kalkulator Kesenjangan yang Dibundel
Cara Menghitung Pooled Variance di Excel