วิธีทำการทดสอบทีโดยมีขนาดตัวอย่างไม่เท่ากัน


คำถามที่นักเรียนมักถามเมื่อพูดถึงเรื่องสถิติคือ:

เป็นไปได้ไหมที่จะทำการทดสอบทีเมื่อขนาดตัวอย่างของแต่ละกลุ่มไม่เท่ากัน?

คำตอบสั้น ๆ :

ได้ คุณสามารถทำการทดสอบทีได้เมื่อขนาดตัวอย่างไม่เท่ากัน ขนาดตัวอย่างที่เท่ากันไม่ใช่ ข้อสันนิษฐาน ในการทดสอบที

ปัญหาที่แท้จริงเกิดขึ้นเมื่อทั้งสองตัวอย่างมีความแปรปรวนไม่เท่ากัน ซึ่ง เป็น หนึ่งในสมมติฐานที่เกิดขึ้นในการทดสอบที

เมื่อสิ่งนี้เกิดขึ้น ขอแนะนำให้ใช้ การทดสอบของ Welch แทน ซึ่งไม่ถือว่าความแปรปรวนเท่ากัน

ตัวอย่างต่อไปนี้แสดงวิธีดำเนินการทดสอบ T ด้วยขนาดตัวอย่างที่ไม่เท่ากัน เมื่อความแปรปรวนเท่ากันและเมื่อไม่เท่ากัน

ตัวอย่างที่ 1: ขนาดตัวอย่างไม่เท่ากันและความแปรปรวนที่เท่ากัน

สมมติว่าเราจัดโปรแกรมสองโปรแกรมที่ออกแบบมาเพื่อช่วยให้นักเรียนทำข้อสอบได้ดีขึ้น

ผลลัพธ์มีดังนี้:

โปรแกรม 1:

  • n (ขนาดตัวอย่าง): 500
  • x (ค่าเฉลี่ยตัวอย่าง): 80
  • s (ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง): 5

โปรแกรม 2:

  • n (ขนาดตัวอย่าง): 20
  • x (ค่าเฉลี่ยตัวอย่าง): 85
  • s (ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง): 5

รหัสต่อไปนี้แสดงวิธีสร้าง boxplot ใน R เพื่อให้เห็นภาพการกระจายคะแนนสอบสำหรับแต่ละโปรแกรม:

 #make this example reproducible
set. seeds (1)

#create vectors to hold exam scores
program1 <- rnorm(500, mean=80, sd=5)
program2 <- rnorm(20, mean=85, sd=5)

#create boxplots to visualize distribution of exam scores
boxplot(program1, program2, names=c(" Program 1 "," Program 2 "))

คะแนนสอบเฉลี่ยสำหรับโปรแกรมที่ 2 ดูเหมือนจะสูงกว่า แต่คะแนนสอบระหว่างทั้งสองโปรแกรมจะเท่ากันโดยประมาณ

รหัสต่อไปนี้แสดงวิธีดำเนินการทดสอบตัวอย่างอิสระด้วยการทดสอบของ Welch:

 #perform independent samples t-test
t. test (program1, program2, var. equal = TRUE )

	Two Sample t-test

data: program1 and program2
t = -3.3348, df = 518, p-value = 0.0009148
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -6.111504 -1.580245
sample estimates:
mean of x mean of y 
 80.11322 83.95910

#perform Welch's two sample t-test
t. test (program1, program2, var. equal = FALSE )

	Welch Two Sample t-test

data: program1 and program2
t = -3.3735, df = 20.589, p-value = 0.00293
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -6.219551 -1.472199
sample estimates:
mean of x mean of y 
 80.11322 83.95910 

ตัวอย่างอิสระ t-test ส่งกลับค่า p-value 0.0009 และ t-test ของ Welch ส่งกลับค่า p-value 0.0029

เนื่องจากค่า p ของการทดสอบแต่ละครั้งน้อยกว่า 0.05 เราจะปฏิเสธสมมติฐานที่เป็นโมฆะในการทดสอบแต่ละครั้ง และสรุปว่าคะแนนสอบเฉลี่ยระหว่างทั้งสองโปรแกรมมีความแตกต่างอย่างมีนัยสำคัญทางสถิติ

แม้ว่าขนาดตัวอย่างจะไม่เท่ากัน แต่การทดสอบ t-test ของตัวอย่างอิสระและการทดสอบ t ของ Welch ทั้งคู่ให้ผลลัพธ์ที่คล้ายคลึงกัน เนื่องจากทั้งสองตัวอย่างมีความแปรปรวนเท่ากัน

ตัวอย่างที่ 2: ขนาดตัวอย่างไม่เท่ากันและความแปรปรวนไม่เท่ากัน

สมมติว่าเราจัดโปรแกรมสองโปรแกรมที่ออกแบบมาเพื่อช่วยให้นักเรียนทำข้อสอบได้ดีขึ้น

ผลลัพธ์มีดังนี้:

โปรแกรม 1:

  • n (ขนาดตัวอย่าง): 500
  • x (ค่าเฉลี่ยตัวอย่าง): 80
  • s (ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง): 25

โปรแกรม 2:

  • n (ขนาดตัวอย่าง): 20
  • x (ค่าเฉลี่ยตัวอย่าง): 85
  • s (ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง): 5

รหัสต่อไปนี้แสดงวิธีสร้าง boxplot ใน R เพื่อให้เห็นภาพการกระจายคะแนนสอบสำหรับแต่ละโปรแกรม:

 #make this example reproducible
set. seeds (1)

#create vectors to hold exam scores
program1 <- rnorm(500, mean=80, sd=25)
program2 <- rnorm(20, mean=85, sd=5)

#create boxplots to visualize distribution of exam scores
boxplot(program1, program2, names=c(" Program 1 "," Program 2 "))

คะแนนสอบเฉลี่ยสำหรับโปรแกรม 2 ดูเหมือนจะสูงกว่า แต่ความแปรปรวนของคะแนนสอบสำหรับโปรแกรม 1 นั้นสูงกว่าคะแนนสอบของโปรแกรม 2 มาก

รหัสต่อไปนี้แสดงวิธีดำเนินการทดสอบตัวอย่างอิสระด้วยการทดสอบของ Welch:

 #perform independent samples t-test
t. test (program1, program2, var. equal = TRUE )

	Two Sample t-test

data: program1 and program2
t = -0.5988, df = 518, p-value = 0.5496
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -14.52474 7.73875
sample estimates:
mean of x mean of y 
  80.5661 83.9591

#perform Welch's two sample t-test
t. test (program1, program2, var. equal = FALSE )

	Welch Two Sample t-test

data: program1 and program2
t = -2.1338, df = 74.934, p-value = 0.03613
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -6.560690 -0.225296
sample estimates:
mean of x mean of y 
  80.5661 83.9591 

ตัวอย่างอิสระ t-test ส่งกลับค่า p-value 0.5496 และ t-test ของ Welch ส่งกลับค่า p-value 0.0361

ตัวอย่างทีทดสอบอิสระไม่สามารถตรวจจับความแตกต่างของคะแนนสอบโดยเฉลี่ยได้ แต่การทดสอบทีของ Welch สามารถตรวจจับความแตกต่างที่มีนัยสำคัญทางสถิติได้

เนื่องจากตัวอย่างทั้งสองมีความแปรปรวนไม่เท่ากัน มีเพียงการทดสอบ t ของ Welch เท่านั้นที่สามารถตรวจจับความแตกต่างที่มีนัยสำคัญทางสถิติของคะแนนสอบ โดย เฉลี่ย เนื่องจากการทดสอบนี้ไม่ถือว่าความแปรปรวนเท่ากันระหว่างกลุ่ม ตัวอย่าง

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับการทดสอบที:

ความรู้เบื้องต้นเกี่ยวกับการทดสอบทีตัวอย่างเดียว
ความรู้เบื้องต้นเกี่ยวกับการทดสอบทีสองตัวอย่าง
ความรู้เบื้องต้นเกี่ยวกับตัวอย่างทีทดสอบแบบจับคู่

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *