วิธีดำเนินการตัวอย่าง t-test แบบจับคู่ใน python
การทดสอบทีแบบจับคู่ตัวอย่าง ใช้เพื่อเปรียบเทียบค่าเฉลี่ยของสองตัวอย่าง เมื่อการสังเกตแต่ละครั้งในตัวอย่างหนึ่งสามารถเชื่อมโยงกับการสังเกตในอีกตัวอย่างหนึ่งได้
บทช่วยสอนนี้จะอธิบายวิธีดำเนินการทดสอบตัวอย่างแบบจับคู่ใน Python
ตัวอย่าง: การทดสอบ T ตัวอย่างที่จับคู่ใน Python
สมมติว่าเราต้องการทราบว่าหลักสูตรหนึ่งๆ มีผลกระทบอย่างมีนัยสำคัญต่อผลการเรียนของนักเรียนในการสอบนั้นๆ หรือไม่ เพื่อทดสอบสิ่งนี้ เราขอให้นักเรียน 15 คนในชั้นเรียนทำแบบทดสอบล่วงหน้า จากนั้นให้นักเรียนแต่ละคนมีส่วนร่วมในหลักสูตรเป็นเวลาสองสัปดาห์ จากนั้นให้นักเรียนทำแบบทดสอบความยากที่คล้ายกันอีกครั้ง
เพื่อเปรียบเทียบความแตกต่างระหว่างคะแนนเฉลี่ยของการทดสอบครั้งแรกและครั้งที่สอง เราใช้ตัวอย่าง t-test ที่จับคู่กัน เนื่องจากสำหรับนักเรียนแต่ละคน คะแนนในการทดสอบครั้งแรกสามารถเชื่อมโยงกับคะแนนในการทดสอบครั้งที่สองได้
ทำตามขั้นตอนต่อไปนี้ให้เสร็จสิ้นเพื่อทำการทดสอบตัวอย่างแบบจับคู่ใน Python
ขั้นตอนที่ 1: สร้างข้อมูล
ขั้นแรก เราจะสร้างตารางสองตารางเพื่อรวบรวมคะแนนก่อนและหลังการทดสอบ:
pre = [88, 82, 84, 93, 75, 78, 84, 87, 95, 91, 83, 89, 77, 68, 91] post = [91, 84, 88, 90, 79, 80, 88, 90, 90, 96, 88, 89, 81, 74, 92]
ขั้นตอนที่ 2: ทำการทดสอบ T-test ตัวอย่างที่จับคู่กัน
ต่อไป เราจะใช้ ฟังก์ชัน ttest_rel() จากไลบรารี scipy.stats เพื่อทำการทดสอบ t-test แบบจับคู่ ซึ่งใช้ไวยากรณ์ต่อไปนี้:
test_rel(ก, ข)
ทอง:
- ก: ตารางตัวอย่างการสังเกตจากกลุ่มที่ 1
- b: ตารางตัวอย่างการสังเกตจากกลุ่มที่ 2
ต่อไปนี้คือวิธีใช้ฟังก์ชันนี้ในตัวอย่างเฉพาะของเรา:
import scipy.stats as stats #perform the paired samples t-test stats.ttest_rel(pre, post) (statistic=-2.9732, pvalue=0.0101)
สถิติการทดสอบคือ -2.9732 และค่า p-value สองด้านที่สอดคล้องกันคือ 0.0101
ขั้นตอนที่ 3: ตีความผลลัพธ์
ในตัวอย่างนี้ การทดสอบทีตัวอย่างที่จับคู่กันจะใช้สมมติฐานว่างและสมมุติฐานทางเลือกต่อไปนี้:
H 0 : คะแนนสอบก่อนและหลังสอบเฉลี่ยเท่ากัน
HA : คะแนนสอบก่อนและหลังสอบเฉลี่ย ไม่ เท่ากัน
เนื่องจากค่า p ( 0.0101 ) น้อยกว่า 0.05 เราจึงปฏิเสธสมมติฐานว่าง เรามีหลักฐานเพียงพอที่จะบอกว่าคะแนนสอบเฉลี่ยที่แท้จริงแตกต่างกันสำหรับนักเรียนก่อนและหลังเข้าร่วมโปรแกรมการศึกษา