วิธีการคำนวณผลต่างรวมใน r


ในสถิติ ความแปรปรวนของคลัสเตอร์ หมายถึงค่าเฉลี่ยของความแปรปรวนของคลัสเตอร์ตั้งแต่ 2 รายการขึ้นไป

เราใช้คำว่า “รวมกลุ่ม” เพื่อระบุว่าเรากำลัง “รวมกลุ่ม” ผลต่างกลุ่มตั้งแต่ 2 รายการขึ้นไปเพื่อให้ได้ตัวเลขเดียวสำหรับความแปรปรวนร่วมระหว่างกลุ่ม

ในทางปฏิบัติ ความแปรปรวนรวมกลุ่มมักใช้ใน การทดสอบค่าทีแบบสองตัวอย่าง ซึ่งใช้เพื่อพิจารณาว่าค่าเฉลี่ยของประชากรทั้งสองเท่ากันหรือไม่

โดยทั่วไปความแปรปรวนรวมกลุ่มระหว่างสองตัวอย่างจะแสดงแทน sp 2 และคำนวณได้ดังนี้:

sp 2 = ( (n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)

น่าเสียดายที่ไม่มีฟังก์ชันในตัวสำหรับคำนวณความแปรปรวนรวมระหว่างสองกลุ่มใน R แต่เราสามารถคำนวณได้ค่อนข้างง่าย

ตัวอย่างเช่น สมมติว่าเราต้องการคำนวณผลต่างรวมกลุ่มระหว่างสองกลุ่มต่อไปนี้:

รหัสต่อไปนี้แสดงวิธีการคำนวณผลต่างรวมกลุ่มระหว่างกลุ่มเหล่านี้ใน R:

 #define groups of data
x1 <- c(6, 7, 7, 8, 10, 11, 13, 14, 14, 16, 18, 19, 19, 19, 20)
x2 <- c(5, 7, 7, 8, 10, 13, 14, 15, 19, 20, 20, 23, 25, 28, 32)

#calculate sample size of each group
n1 <- length(x1)
n2 <- length(x2)

#calculate sample variance of each group
var1 <- var(x1)
var2 <- var(x2)

#calculate pooled variance between the two groups
pooled <- ((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2)

#display pooled variance
pooled

[1] 46.97143

ความแปรปรวนร่วมระหว่างสองกลุ่มนี้กลายเป็น 46.97143

แหล่งข้อมูลเพิ่มเติม

ความแปรปรวนแบบคลัสเตอร์คืออะไร? (คำจำกัดความและตัวอย่าง)
เครื่องคิดเลข Gap ที่แถมมา
วิธีการคำนวณความแปรปรวนรวมใน Excel

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *