Cara menghitung varians gabungan di r


Dalam statistik, varian klaster mengacu pada rata-rata dari dua atau lebih varian klaster.

Kita menggunakan kata “dikumpulkan” untuk menunjukkan bahwa kita “menggabungkan” dua atau lebih varian kelompok untuk mendapatkan satu angka untuk varian umum antar kelompok.

Dalam praktiknya, varians yang dikumpulkan paling sering digunakan dalam uji-t dua sampel , yang digunakan untuk menentukan apakah rata-rata dua populasi sama atau tidak.

Varians yang dikumpulkan antara dua sampel umumnya dilambangkan sp 2 dan dihitung sebagai berikut:

s p 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)

Sayangnya, tidak ada fungsi bawaan untuk menghitung varians gabungan antara dua grup di R, namun kita dapat menghitungnya dengan cukup mudah.

Misalnya, kita ingin menghitung varians gabungan antara dua kelompok berikut:

Kode berikut menunjukkan cara menghitung varians gabungan antara grup-grup ini di R:

 #define groups of data
x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20)
x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32)

#calculate sample size of each group
n1 <- length(x1)
n2 <- length(x2)

#calculate sample variance of each group
var1 <- var(x1)
var2 <- var(x2)

#calculate pooled variance between the two groups
pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2)

#display pooled variance
pooled

[1] 46.97143

Varians yang dikumpulkan antara kedua kelompok ini adalah 46.97143 .

Sumber daya tambahan

Apa itu varians berkerumun? (Definisi dan contoh)
Kalkulator Kesenjangan yang Dibundel
Cara Menghitung Pooled Variance di Excel

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *