วิธีดำเนินการทดสอบ jarque-bera ใน python


การทดสอบ Jarque-Bera เป็นการทดสอบความพอดีที่จะพิจารณาว่าข้อมูลตัวอย่างมีความเบ้และความโด่งที่สอดคล้องกับการแจกแจงแบบปกติหรือไม่

สถิติการทดสอบ Jarque-Bera จะเป็นจำนวนบวกเสมอ และยิ่งอยู่ห่างจากศูนย์มากเท่าใด ก็ยิ่งมีหลักฐานมากขึ้นว่าข้อมูลตัวอย่างไม่เป็นไปตามการแจกแจงแบบปกติ

บทช่วยสอนนี้จะอธิบายวิธีดำเนินการทดสอบ Jarque-Bera ใน Python

วิธีดำเนินการทดสอบ Jarque-Bera ใน Python

หากต้องการดำเนินการทดสอบ Jarque-Bera ใน Python คุณสามารถใช้ ฟังก์ชัน jarque_bera จากไลบรารี Scipy ซึ่งใช้ไวยากรณ์ต่อไปนี้:

jarque_bera(x)

ทอง:

  • x: ตารางการสังเกต

ฟังก์ชันนี้ส่งคืนสถิติการทดสอบและค่า p ที่สอดคล้องกัน

ตัวอย่างที่ 1

สมมติว่าเราทำการทดสอบ Jarque-Bera ในรายการ 5,000 ค่าที่เป็นไปตามการแจกแจงแบบปกติ:

 import numpy as np
import scipy.stats as stats

#generate array of 5000 values that follows a standard normal distribution
np.random.seed(0)
data = np.random.normal(0, 1, 5000)

#perform Jarque-Bera test
stats.jarque_bera(data)

(statistic=1.2287, pvalue=0.54098)

สถิติการทดสอบคือ 1.2287 และค่า p ที่สอดคล้องกันคือ 0.54098 เนื่องจากค่า p นี้ไม่น้อยกว่า 0.05 เราจึงไม่สามารถปฏิเสธสมมติฐานว่างได้ เราไม่มีหลักฐานเพียงพอที่จะกล่าวได้ว่าข้อมูลเหล่านี้มีความเบ้และความโด่งที่แตกต่างจากการแจกแจงแบบปกติอย่างมีนัยสำคัญ

ผลลัพธ์นี้ไม่น่าประหลาดใจเนื่องจากข้อมูลที่เราสร้างขึ้นประกอบด้วยตัวแปรสุ่ม 5,000 ตัวที่เป็นไปตามการแจกแจงแบบปกติ

ตัวอย่างที่ 2

ตอนนี้ สมมติว่าเราทำการทดสอบ Jarque-Bera ในรายการ 5,000 ค่าที่เป็นไปตามการแจกแจงแบบสม่ำเสมอ:

 import numpy as np
import scipy.stats as stats

#generate array of 5000 values that follows a uniform distribution
np.random.seed(0)
data = np.random.uniform(0, 1, 5000)

#perform Jarque-Bera test
stats.jarque_bera(data)

(statistic=300.1043, pvalue=0.0)

สถิติการทดสอบคือ 300.1043 และค่า p ที่สอดคล้องกันคือ 0.0 เนื่องจากค่า p นี้น้อยกว่า 0.05 เราจึงปฏิเสธสมมติฐานว่าง ดังนั้นเราจึงมีหลักฐานเพียงพอที่จะโต้แย้งว่าข้อมูลเหล่านี้แสดงความเบ้และความโด่งที่แตกต่างกันอย่างมีนัยสำคัญมากกว่าการแจกแจงแบบปกติ

ผลลัพธ์นี้ก็ไม่น่าแปลกใจเช่นกัน เนื่องจากข้อมูลที่เราสร้างประกอบด้วยตัวแปรสุ่ม 5,000 ตัวที่เป็นไปตามการแจกแจงแบบสม่ำเสมอ ซึ่งควรจะมีความเบ้และความโด่งที่แตกต่างจากการแจกแจงแบบปกติอย่างมาก

เมื่อใดจึงควรใช้การทดสอบ Jarque-Bera

โดยทั่วไปการทดสอบ Jarque-Bera ใช้สำหรับชุดข้อมูลขนาดใหญ่ (n > 2,000) ซึ่งการทดสอบภาวะปกติอื่นๆ (เช่น การทดสอบ Shapiro-Wilk) ไม่น่าเชื่อถือ

นี่เป็นการทดสอบที่เหมาะสมเพื่อใช้ก่อนทำการวิเคราะห์ โดยจะถือว่าชุดข้อมูลเป็นไปตามการแจกแจงแบบปกติ การทดสอบ Jarque-Bera สามารถบอกคุณได้ว่าสมมติฐานนี้น่าพอใจหรือไม่

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *