วิธีดำเนินการทดสอบรันไทม์ใน python
การทดสอบรัน คือการทดสอบทางสถิติที่ใช้ในการพิจารณาว่าชุดข้อมูลที่มาจากกระบวนการสุ่มหรือไม่
สมมติฐาน ว่างและทางเลือก ของการทดสอบมีดังนี้:
H 0 (null): ข้อมูลถูกสร้างขึ้นแบบสุ่ม
H a (ทางเลือก): ข้อมูล ไม่ได้ ถูกสร้างขึ้นแบบสุ่ม
บทช่วยสอนนี้จะอธิบายสองวิธีที่คุณสามารถใช้เพื่อทดสอบการทำงานใน Python
ตัวอย่าง: ทำการทดสอบใน Python
เราสามารถดำเนินการทดสอบการทำงานกับชุดข้อมูลที่กำหนดใน Python ได้โดยใช้ฟังก์ชัน runtest_1samp() จากไลบรารี statsmodels ซึ่งใช้ไวยากรณ์ต่อไปนี้:
runtest_1samp(x, cutoff=’mean’, การแก้ไข=True)
ทอง:
- x: อาร์เรย์ของค่าข้อมูล
- จุดตัด: เกณฑ์ที่จะใช้เพื่อแบ่งข้อมูลออกเป็นค่าขนาดใหญ่และขนาดเล็ก ค่าเริ่มต้นคือ “เฉลี่ย” แต่คุณสามารถระบุ “ค่ามัธยฐาน” เป็นทางเลือกแทนได้
- การแก้ไข: สำหรับขนาดตัวอย่างที่น้อยกว่า 50 ฟังก์ชันนี้จะลบ 0.5 เป็นการแก้ไข คุณสามารถระบุเป็นเท็จเพื่อปิดใช้งานการแก้ไขนี้ได้
ฟังก์ชันนี้สร้างสถิติการทดสอบ az และค่า p-value ที่สอดคล้องกันเป็นเอาต์พุต
รหัสต่อไปนี้แสดงวิธีดำเนินการทดสอบการทำงานโดยใช้ฟังก์ชันนี้ใน Python:
from statsmodels. sandbox . stats . runs import runstest_1samp #create dataset data = [12, 16, 16, 15, 14, 18, 19, 21, 13, 13] #Perform Runs test runstest_1samp(data, correction= False ) (-0.6708203932499369, 0.5023349543605021)
สถิติการทดสอบ z กลายเป็น -0.67082 และค่า p ที่สอดคล้องกันคือ 0.50233 เนื่องจากค่า p นี้ไม่น้อยกว่า α = 0.05 เราจึงไม่สามารถปฏิเสธสมมติฐานว่างได้ เรามีหลักฐานเพียงพอที่จะบอกว่าข้อมูลถูกสร้างขึ้นแบบสุ่ม
หมายเหตุ : สำหรับตัวอย่างนี้ เราได้ปิดใช้งานการแก้ไขเมื่อคำนวณสถิติการทดสอบ ซึ่งตรงกับสูตรที่ใช้ในการ ทดสอบการทำงานใน R ซึ่งไม่ใช้การแก้ไขเมื่อทำการทดสอบ