วิธีทำการทดสอบทีโดยมีขนาดตัวอย่างไม่เท่ากัน
คำถามที่นักเรียนมักถามเมื่อพูดถึงเรื่องสถิติคือ:
เป็นไปได้ไหมที่จะทำการทดสอบทีเมื่อขนาดตัวอย่างของแต่ละกลุ่มไม่เท่ากัน?
คำตอบสั้น ๆ :
ได้ คุณสามารถทำการทดสอบทีได้เมื่อขนาดตัวอย่างไม่เท่ากัน ขนาดตัวอย่างที่เท่ากันไม่ใช่ ข้อสันนิษฐาน ในการทดสอบที
ปัญหาที่แท้จริงเกิดขึ้นเมื่อทั้งสองตัวอย่างมีความแปรปรวนไม่เท่ากัน ซึ่ง เป็น หนึ่งในสมมติฐานที่เกิดขึ้นในการทดสอบที
เมื่อสิ่งนี้เกิดขึ้น ขอแนะนำให้ใช้ การทดสอบของ Welch แทน ซึ่งไม่ถือว่าความแปรปรวนเท่ากัน
ตัวอย่างต่อไปนี้แสดงวิธีดำเนินการทดสอบ T ด้วยขนาดตัวอย่างที่ไม่เท่ากัน เมื่อความแปรปรวนเท่ากันและเมื่อไม่เท่ากัน
ตัวอย่างที่ 1: ขนาดตัวอย่างไม่เท่ากันและความแปรปรวนที่เท่ากัน
สมมติว่าเราจัดโปรแกรมสองโปรแกรมที่ออกแบบมาเพื่อช่วยให้นักเรียนทำข้อสอบได้ดีขึ้น
ผลลัพธ์มีดังนี้:
โปรแกรม 1:
- n (ขนาดตัวอย่าง): 500
- x (ค่าเฉลี่ยตัวอย่าง): 80
- s (ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง): 5
โปรแกรม 2:
- n (ขนาดตัวอย่าง): 20
- x (ค่าเฉลี่ยตัวอย่าง): 85
- s (ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง): 5
รหัสต่อไปนี้แสดงวิธีสร้าง boxplot ใน R เพื่อให้เห็นภาพการกระจายคะแนนสอบสำหรับแต่ละโปรแกรม:
#make this example reproducible set. seeds (1) #create vectors to hold exam scores program1 <- rnorm(500, mean=80, sd=5) program2 <- rnorm(20, mean=85, sd=5) #create boxplots to visualize distribution of exam scores boxplot(program1, program2, names=c(" Program 1 "," Program 2 "))

คะแนนสอบเฉลี่ยสำหรับโปรแกรมที่ 2 ดูเหมือนจะสูงกว่า แต่คะแนนสอบระหว่างทั้งสองโปรแกรมจะเท่ากันโดยประมาณ
รหัสต่อไปนี้แสดงวิธีดำเนินการทดสอบตัวอย่างอิสระด้วยการทดสอบของ Welch:
#perform independent samples t-test t. test (program1, program2, var. equal = TRUE ) Two Sample t-test data: program1 and program2 t = -3.3348, df = 518, p-value = 0.0009148 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -6.111504 -1.580245 sample estimates: mean of x mean of y 80.11322 83.95910 #perform Welch's two sample t-test t. test (program1, program2, var. equal = FALSE ) Welch Two Sample t-test data: program1 and program2 t = -3.3735, df = 20.589, p-value = 0.00293 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -6.219551 -1.472199 sample estimates: mean of x mean of y 80.11322 83.95910
ตัวอย่างอิสระ t-test ส่งกลับค่า p-value 0.0009 และ t-test ของ Welch ส่งกลับค่า p-value 0.0029
เนื่องจากค่า p ของการทดสอบแต่ละครั้งน้อยกว่า 0.05 เราจะปฏิเสธสมมติฐานที่เป็นโมฆะในการทดสอบแต่ละครั้ง และสรุปว่าคะแนนสอบเฉลี่ยระหว่างทั้งสองโปรแกรมมีความแตกต่างอย่างมีนัยสำคัญทางสถิติ
แม้ว่าขนาดตัวอย่างจะไม่เท่ากัน แต่การทดสอบ t-test ของตัวอย่างอิสระและการทดสอบ t ของ Welch ทั้งคู่ให้ผลลัพธ์ที่คล้ายคลึงกัน เนื่องจากทั้งสองตัวอย่างมีความแปรปรวนเท่ากัน
ตัวอย่างที่ 2: ขนาดตัวอย่างไม่เท่ากันและความแปรปรวนไม่เท่ากัน
สมมติว่าเราจัดโปรแกรมสองโปรแกรมที่ออกแบบมาเพื่อช่วยให้นักเรียนทำข้อสอบได้ดีขึ้น
ผลลัพธ์มีดังนี้:
โปรแกรม 1:
- n (ขนาดตัวอย่าง): 500
- x (ค่าเฉลี่ยตัวอย่าง): 80
- s (ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง): 25
โปรแกรม 2:
- n (ขนาดตัวอย่าง): 20
- x (ค่าเฉลี่ยตัวอย่าง): 85
- s (ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง): 5
รหัสต่อไปนี้แสดงวิธีสร้าง boxplot ใน R เพื่อให้เห็นภาพการกระจายคะแนนสอบสำหรับแต่ละโปรแกรม:
#make this example reproducible set. seeds (1) #create vectors to hold exam scores program1 <- rnorm(500, mean=80, sd=25) program2 <- rnorm(20, mean=85, sd=5) #create boxplots to visualize distribution of exam scores boxplot(program1, program2, names=c(" Program 1 "," Program 2 "))

คะแนนสอบเฉลี่ยสำหรับโปรแกรม 2 ดูเหมือนจะสูงกว่า แต่ความแปรปรวนของคะแนนสอบสำหรับโปรแกรม 1 นั้นสูงกว่าคะแนนสอบของโปรแกรม 2 มาก
รหัสต่อไปนี้แสดงวิธีดำเนินการทดสอบตัวอย่างอิสระด้วยการทดสอบของ Welch:
#perform independent samples t-test t. test (program1, program2, var. equal = TRUE ) Two Sample t-test data: program1 and program2 t = -0.5988, df = 518, p-value = 0.5496 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -14.52474 7.73875 sample estimates: mean of x mean of y 80.5661 83.9591 #perform Welch's two sample t-test t. test (program1, program2, var. equal = FALSE ) Welch Two Sample t-test data: program1 and program2 t = -2.1338, df = 74.934, p-value = 0.03613 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -6.560690 -0.225296 sample estimates: mean of x mean of y 80.5661 83.9591
ตัวอย่างอิสระ t-test ส่งกลับค่า p-value 0.5496 และ t-test ของ Welch ส่งกลับค่า p-value 0.0361
ตัวอย่างทีทดสอบอิสระไม่สามารถตรวจจับความแตกต่างของคะแนนสอบโดยเฉลี่ยได้ แต่การทดสอบทีของ Welch สามารถตรวจจับความแตกต่างที่มีนัยสำคัญทางสถิติได้
เนื่องจากตัวอย่างทั้งสองมีความแปรปรวนไม่เท่ากัน มีเพียงการทดสอบ t ของ Welch เท่านั้นที่สามารถตรวจจับความแตกต่างที่มีนัยสำคัญทางสถิติของคะแนนสอบ โดย เฉลี่ย เนื่องจากการทดสอบนี้ไม่ถือว่าความแปรปรวนเท่ากันระหว่างกลุ่ม ตัวอย่าง
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับการทดสอบที:
ความรู้เบื้องต้นเกี่ยวกับการทดสอบทีตัวอย่างเดียว
ความรู้เบื้องต้นเกี่ยวกับการทดสอบทีสองตัวอย่าง
ความรู้เบื้องต้นเกี่ยวกับตัวอย่างทีทดสอบแบบจับคู่