วิธีดำเนินการทดสอบ t สองตัวอย่างใน python


การทดสอบทีแบบสองตัวอย่าง ใช้เพื่อทดสอบว่าค่าเฉลี่ยของประชากรทั้งสองเท่ากันหรือไม่

บทช่วยสอนนี้จะอธิบายวิธีดำเนินการทดสอบ t-test สองตัวอย่างใน Python

ตัวอย่าง: ตัวอย่างการทดสอบ t-test สองตัวอย่างใน Python

นักวิจัยต้องการทราบว่าพืชสองชนิดที่แตกต่างกันมีความสูงเฉลี่ยเท่ากันหรือไม่ เพื่อทดสอบสิ่งนี้ พวกเขา สุ่มตัวอย่าง พืชแต่ละสายพันธุ์จำนวน 20 ต้น

ทำตามขั้นตอนต่อไปนี้เพื่อทำการทดสอบค่าทีสองตัวอย่างเพื่อตรวจสอบว่าพืชทั้งสองชนิดมีความสูงเท่ากันหรือไม่

ขั้นตอนที่ 1: สร้างข้อมูล

ขั้นแรก เราจะสร้างตารางสองตารางเพื่อเก็บการวัดสำหรับกลุ่มพืช 20 ต้นแต่ละกลุ่ม:

 import numpy as np

group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12])
group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])

ขั้นตอนที่ 2: ทำการทดสอบทีสองตัวอย่าง

ต่อไป เราจะใช้ ฟังก์ชัน ttest_ind() จากไลบรารี scipy.stats เพื่อทำการทดสอบ t-test สองตัวอย่าง ซึ่งใช้ไวยากรณ์ต่อไปนี้:

ttest_ind(ก, ข, เท่ากับ_var=จริง)

ทอง:

  • ก: ตารางตัวอย่างข้อสังเกตสำหรับกลุ่มที่ 1
  • b: ตารางตัวอย่างการสังเกตสำหรับกลุ่มที่ 2
  • equal_var: หากเป็นจริง ให้ทำการทดสอบทีอิสระ 2 ตัวอย่างมาตรฐานที่ถือว่าความแปรปรวนของประชากรเท่ากัน หากเป็นเท็จ ให้ดำเนินการ t-test ของ Welch ซึ่งไม่ถือว่าความแปรปรวนของประชากรเท่ากัน สิ่งนี้เป็นจริงตามค่าเริ่มต้น

ก่อนทำการทดสอบ เราต้องตัดสินใจว่าจะถือว่าประชากรทั้งสองมีความแปรปรวนเท่ากันหรือไม่ โดยทั่วไป เราสามารถสรุปได้ว่าประชากรมีความแปรปรวนเท่ากัน หากอัตราส่วนของความแปรปรวนตัวอย่างที่ใหญ่ที่สุดต่อความแปรปรวนตัวอย่างที่เล็กที่สุดน้อยกว่า 4:1

 #find variance for each group
print(np.var(group1), np.var(group2))

7.73 12.26

อัตราส่วนของความแปรปรวนตัวอย่างที่ใหญ่ที่สุดต่อความแปรปรวนตัวอย่างที่น้อยที่สุดคือ 12.26/7.73 = 1.586 ซึ่งน้อยกว่า 4 ซึ่งหมายความว่าเราสามารถสรุปได้ว่าความแปรปรวนของประชากรเท่ากัน

ดังนั้น เราสามารถดำเนินการทดสอบ t สองตัวอย่างโดยมีความแปรปรวนเท่ากันได้:

 import scipy.stats as stats

#perform two sample t-test with equal variances
stats.ttest_ind(a=group1, b=group2, equal_var=True)

(statistic=-0.6337, pvalue=0.53005)

สถิติการทดสอบทีคือ -0.6337 และค่า p-value สองด้านที่สอดคล้องกันคือ 0.53005

ขั้นตอนที่ 3: ตีความผลลัพธ์

สมมติฐานสองข้อสำหรับการทดสอบทีสองตัวอย่างนี้คือ:

H 0 : µ 1 = µ 2 (ค่าเฉลี่ยประชากรทั้งสองเท่ากัน)

HA : µ 1 ≠µ 2 (ค่าเฉลี่ยประชากรทั้งสอง ไม่ เท่ากัน)

เนื่องจากค่า p ของการทดสอบของเรา (0.53005) มากกว่าอัลฟา = 0.05 เราจึงไม่สามารถปฏิเสธสมมติฐานว่างของการทดสอบได้ เราไม่มีหลักฐานเพียงพอที่จะบอกว่าความสูงของพืชโดยเฉลี่ยระหว่างประชากรทั้งสองนั้นแตกต่างกัน

แหล่งข้อมูลเพิ่มเติม

วิธีดำเนินการทดสอบ T-Test หนึ่งตัวอย่างใน Python
วิธีดำเนินการตัวอย่าง T-Test แบบจับคู่ใน Python

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *