วิธีดำเนินการทดสอบ jarque-bera ใน python
การทดสอบ Jarque-Bera เป็นการทดสอบความพอดีที่จะพิจารณาว่าข้อมูลตัวอย่างมีความเบ้และความโด่งที่สอดคล้องกับการแจกแจงแบบปกติหรือไม่
สถิติการทดสอบ Jarque-Bera จะเป็นจำนวนบวกเสมอ และยิ่งอยู่ห่างจากศูนย์มากเท่าใด ก็ยิ่งมีหลักฐานมากขึ้นว่าข้อมูลตัวอย่างไม่เป็นไปตามการแจกแจงแบบปกติ
บทช่วยสอนนี้จะอธิบายวิธีดำเนินการทดสอบ Jarque-Bera ใน Python
วิธีดำเนินการทดสอบ Jarque-Bera ใน Python
หากต้องการดำเนินการทดสอบ Jarque-Bera ใน Python คุณสามารถใช้ ฟังก์ชัน jarque_bera จากไลบรารี Scipy ซึ่งใช้ไวยากรณ์ต่อไปนี้:
jarque_bera(x)
ทอง:
- x: ตารางการสังเกต
ฟังก์ชันนี้ส่งคืนสถิติการทดสอบและค่า p ที่สอดคล้องกัน
ตัวอย่างที่ 1
สมมติว่าเราทำการทดสอบ Jarque-Bera ในรายการ 5,000 ค่าที่เป็นไปตามการแจกแจงแบบปกติ:
import numpy as np import scipy.stats as stats #generate array of 5000 values that follows a standard normal distribution np.random.seed(0) data = np.random.normal(0, 1, 5000) #perform Jarque-Bera test stats.jarque_bera(data) (statistic=1.2287, pvalue=0.54098)
สถิติการทดสอบคือ 1.2287 และค่า p ที่สอดคล้องกันคือ 0.54098 เนื่องจากค่า p นี้ไม่น้อยกว่า 0.05 เราจึงไม่สามารถปฏิเสธสมมติฐานว่างได้ เราไม่มีหลักฐานเพียงพอที่จะกล่าวได้ว่าข้อมูลเหล่านี้มีความเบ้และความโด่งที่แตกต่างจากการแจกแจงแบบปกติอย่างมีนัยสำคัญ
ผลลัพธ์นี้ไม่น่าประหลาดใจเนื่องจากข้อมูลที่เราสร้างขึ้นประกอบด้วยตัวแปรสุ่ม 5,000 ตัวที่เป็นไปตามการแจกแจงแบบปกติ
ตัวอย่างที่ 2
ตอนนี้ สมมติว่าเราทำการทดสอบ Jarque-Bera ในรายการ 5,000 ค่าที่เป็นไปตามการแจกแจงแบบสม่ำเสมอ:
import numpy as np import scipy.stats as stats #generate array of 5000 values that follows a uniform distribution np.random.seed(0) data = np.random.uniform(0, 1, 5000) #perform Jarque-Bera test stats.jarque_bera(data) (statistic=300.1043, pvalue=0.0)
สถิติการทดสอบคือ 300.1043 และค่า p ที่สอดคล้องกันคือ 0.0 เนื่องจากค่า p นี้น้อยกว่า 0.05 เราจึงปฏิเสธสมมติฐานว่าง ดังนั้นเราจึงมีหลักฐานเพียงพอที่จะโต้แย้งว่าข้อมูลเหล่านี้แสดงความเบ้และความโด่งที่แตกต่างกันอย่างมีนัยสำคัญมากกว่าการแจกแจงแบบปกติ
ผลลัพธ์นี้ก็ไม่น่าแปลกใจเช่นกัน เนื่องจากข้อมูลที่เราสร้างประกอบด้วยตัวแปรสุ่ม 5,000 ตัวที่เป็นไปตามการแจกแจงแบบสม่ำเสมอ ซึ่งควรจะมีความเบ้และความโด่งที่แตกต่างจากการแจกแจงแบบปกติอย่างมาก
เมื่อใดจึงควรใช้การทดสอบ Jarque-Bera
โดยทั่วไปการทดสอบ Jarque-Bera ใช้สำหรับชุดข้อมูลขนาดใหญ่ (n > 2,000) ซึ่งการทดสอบภาวะปกติอื่นๆ (เช่น การทดสอบ Shapiro-Wilk) ไม่น่าเชื่อถือ
นี่เป็นการทดสอบที่เหมาะสมเพื่อใช้ก่อนทำการวิเคราะห์ โดยจะถือว่าชุดข้อมูลเป็นไปตามการแจกแจงแบบปกติ การทดสอบ Jarque-Bera สามารถบอกคุณได้ว่าสมมติฐานนี้น่าพอใจหรือไม่