आर में जर्क-बेरा परीक्षण कैसे करें


जार्के-बेरा परीक्षण एक अच्छाई-की-फिट परीक्षण है जो यह निर्धारित करता है कि नमूना डेटा सामान्य वितरण के अनुरूप तिरछापन और कर्टोसिस प्रदर्शित करता है या नहीं।

जार्के-बेरा परीक्षण आँकड़ा हमेशा एक सकारात्मक संख्या होती है और यदि यह शून्य से दूर है, तो यह इंगित करता है कि नमूना डेटा में सामान्य वितरण नहीं है।

जेबी परीक्षण आँकड़ा इस प्रकार परिभाषित किया गया है:

जेबी =[(एन-के+1) / 6] * [एस 2 + (0.25*(सी-3) 2 )]

जहां n नमूने में अवलोकनों की संख्या है, k प्रतिगामी की संख्या है (k = 1 यदि प्रतिगमन के संदर्भ में उपयोग नहीं किया जाता है), S नमूने की विषमता है और C नमूने की कुर्टोसिस है।

सामान्यता की शून्य परिकल्पना के तहत, जेबी ~

यह ट्यूटोरियल बताता है कि आर में जर्क-बेरा परीक्षण कैसे करें।

आर में जर्क-बेरा परीक्षण

उदाहरण डेटासेट के लिए जर्क-बेरा परीक्षण करने के लिए, हम tseries पैकेज का उपयोग कर सकते हैं:

 #install (if not already installed) and load tseries package
if(!require(tseries)){install.packages('tseries')}

#generate a list of 100 normally distributed random variables
dataset <- rnorm(100)

#conduct Jarque-Bera test
jarque.bera.test(dataset)

यह निम्नलिखित आउटपुट उत्पन्न करता है:

यह हमें बताता है कि परीक्षण आँकड़ा 0.67446 है और परीक्षण पी-मान 0.7137 है। इस मामले में, हम उस शून्य परिकल्पना को अस्वीकार नहीं कर पाएंगे कि डेटा सामान्य रूप से वितरित किया जाता है।

यह परिणाम आश्चर्यजनक नहीं होना चाहिए क्योंकि हमने जो डेटासेट तैयार किया है वह 100 यादृच्छिक चर से बना है जो सामान्य वितरण का अनुसरण करता है।

इसके बजाय, विचार करें कि क्या हमने 100 समान रूप से वितरित यादृच्छिक चर की सूची वाला एक डेटासेट तैयार किया है:

 #install (if not already installed) and load tseries package
if(!require(tseries)){install.packages('tseries')}

#generate a list of 100 uniformly distributed random variables
dataset <- runif(100)

#conduct Jarque-Bera test
jarque.bera.test(dataset)

यह निम्नलिखित आउटपुट उत्पन्न करता है:

यह हमें बताता है कि परीक्षण आँकड़ा 8.0807 है और परीक्षण पी-मान 0.01759 है। इस मामले में, हम उस शून्य परिकल्पना को अस्वीकार कर देंगे कि डेटा सामान्य रूप से वितरित किया जाता है। हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि इस उदाहरण में डेटा सामान्य रूप से वितरित नहीं है।

यह परिणाम आश्चर्यजनक नहीं होना चाहिए क्योंकि हमने जो डेटासेट तैयार किया है वह 100 यादृच्छिक चर से बना है जो एक समान वितरण का पालन करता है। आख़िरकार, डेटा का उद्देश्य समान रूप से वितरित करना है, सामान्य रूप से नहीं।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *