วิธีดำเนินการทดสอบ t สองตัวอย่างใน python
การทดสอบทีแบบสองตัวอย่าง ใช้เพื่อทดสอบว่าค่าเฉลี่ยของประชากรทั้งสองเท่ากันหรือไม่
บทช่วยสอนนี้จะอธิบายวิธีดำเนินการทดสอบ t-test สองตัวอย่างใน Python
ตัวอย่าง: ตัวอย่างการทดสอบ t-test สองตัวอย่างใน Python
นักวิจัยต้องการทราบว่าพืชสองชนิดที่แตกต่างกันมีความสูงเฉลี่ยเท่ากันหรือไม่ เพื่อทดสอบสิ่งนี้ พวกเขา สุ่มตัวอย่าง พืชแต่ละสายพันธุ์จำนวน 20 ต้น
ทำตามขั้นตอนต่อไปนี้เพื่อทำการทดสอบค่าทีสองตัวอย่างเพื่อตรวจสอบว่าพืชทั้งสองชนิดมีความสูงเท่ากันหรือไม่
ขั้นตอนที่ 1: สร้างข้อมูล
ขั้นแรก เราจะสร้างตารางสองตารางเพื่อเก็บการวัดสำหรับกลุ่มพืช 20 ต้นแต่ละกลุ่ม:
import numpy as np group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12]) group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])
ขั้นตอนที่ 2: ทำการทดสอบทีสองตัวอย่าง
ต่อไป เราจะใช้ ฟังก์ชัน ttest_ind() จากไลบรารี scipy.stats เพื่อทำการทดสอบ t-test สองตัวอย่าง ซึ่งใช้ไวยากรณ์ต่อไปนี้:
ttest_ind(ก, ข, เท่ากับ_var=จริง)
ทอง:
- ก: ตารางตัวอย่างข้อสังเกตสำหรับกลุ่มที่ 1
- b: ตารางตัวอย่างการสังเกตสำหรับกลุ่มที่ 2
- equal_var: หากเป็นจริง ให้ทำการทดสอบทีอิสระ 2 ตัวอย่างมาตรฐานที่ถือว่าความแปรปรวนของประชากรเท่ากัน หากเป็นเท็จ ให้ดำเนินการ t-test ของ Welch ซึ่งไม่ถือว่าความแปรปรวนของประชากรเท่ากัน สิ่งนี้เป็นจริงตามค่าเริ่มต้น
ก่อนทำการทดสอบ เราต้องตัดสินใจว่าจะถือว่าประชากรทั้งสองมีความแปรปรวนเท่ากันหรือไม่ โดยทั่วไป เราสามารถสรุปได้ว่าประชากรมีความแปรปรวนเท่ากัน หากอัตราส่วนของความแปรปรวนตัวอย่างที่ใหญ่ที่สุดต่อความแปรปรวนตัวอย่างที่เล็กที่สุดน้อยกว่า 4:1
#find variance for each group
print(np.var(group1), np.var(group2))
7.73 12.26
อัตราส่วนของความแปรปรวนตัวอย่างที่ใหญ่ที่สุดต่อความแปรปรวนตัวอย่างที่น้อยที่สุดคือ 12.26/7.73 = 1.586 ซึ่งน้อยกว่า 4 ซึ่งหมายความว่าเราสามารถสรุปได้ว่าความแปรปรวนของประชากรเท่ากัน
ดังนั้น เราสามารถดำเนินการทดสอบ t สองตัวอย่างโดยมีความแปรปรวนเท่ากันได้:
import scipy.stats as stats #perform two sample t-test with equal variances stats.ttest_ind(a=group1, b=group2, equal_var=True) (statistic=-0.6337, pvalue=0.53005)
สถิติการทดสอบทีคือ -0.6337 และค่า p-value สองด้านที่สอดคล้องกันคือ 0.53005
ขั้นตอนที่ 3: ตีความผลลัพธ์
สมมติฐานสองข้อสำหรับการทดสอบทีสองตัวอย่างนี้คือ:
H 0 : µ 1 = µ 2 (ค่าเฉลี่ยประชากรทั้งสองเท่ากัน)
HA : µ 1 ≠µ 2 (ค่าเฉลี่ยประชากรทั้งสอง ไม่ เท่ากัน)
เนื่องจากค่า p ของการทดสอบของเรา (0.53005) มากกว่าอัลฟา = 0.05 เราจึงไม่สามารถปฏิเสธสมมติฐานว่างของการทดสอบได้ เราไม่มีหลักฐานเพียงพอที่จะบอกว่าความสูงของพืชโดยเฉลี่ยระหว่างประชากรทั้งสองนั้นแตกต่างกัน
แหล่งข้อมูลเพิ่มเติม
วิธีดำเนินการทดสอบ T-Test หนึ่งตัวอย่างใน Python
วิธีดำเนินการตัวอย่าง T-Test แบบจับคู่ใน Python