आर में जर्क-बेरा परीक्षण कैसे करें
जार्के-बेरा परीक्षण एक अच्छाई-की-फिट परीक्षण है जो यह निर्धारित करता है कि नमूना डेटा सामान्य वितरण के अनुरूप तिरछापन और कर्टोसिस प्रदर्शित करता है या नहीं।
जार्के-बेरा परीक्षण आँकड़ा हमेशा एक सकारात्मक संख्या होती है और यदि यह शून्य से दूर है, तो यह इंगित करता है कि नमूना डेटा में सामान्य वितरण नहीं है।
जेबी परीक्षण आँकड़ा इस प्रकार परिभाषित किया गया है:
जेबी =[(एन-के+1) / 6] * [एस 2 + (0.25*(सी-3) 2 )]
जहां n नमूने में अवलोकनों की संख्या है, k प्रतिगामी की संख्या है (k = 1 यदि प्रतिगमन के संदर्भ में उपयोग नहीं किया जाता है), S नमूने की विषमता है और C नमूने की कुर्टोसिस है।
सामान्यता की शून्य परिकल्पना के तहत, जेबी ~
यह ट्यूटोरियल बताता है कि आर में जर्क-बेरा परीक्षण कैसे करें।
आर में जर्क-बेरा परीक्षण
उदाहरण डेटासेट के लिए जर्क-बेरा परीक्षण करने के लिए, हम tseries पैकेज का उपयोग कर सकते हैं:
#install (if not already installed) and load tseries package if(!require(tseries)){install.packages('tseries')} #generate a list of 100 normally distributed random variables dataset <- rnorm(100) #conduct Jarque-Bera test jarque.bera.test(dataset)
यह निम्नलिखित आउटपुट उत्पन्न करता है:
यह हमें बताता है कि परीक्षण आँकड़ा 0.67446 है और परीक्षण पी-मान 0.7137 है। इस मामले में, हम उस शून्य परिकल्पना को अस्वीकार नहीं कर पाएंगे कि डेटा सामान्य रूप से वितरित किया जाता है।
यह परिणाम आश्चर्यजनक नहीं होना चाहिए क्योंकि हमने जो डेटासेट तैयार किया है वह 100 यादृच्छिक चर से बना है जो सामान्य वितरण का अनुसरण करता है।
इसके बजाय, विचार करें कि क्या हमने 100 समान रूप से वितरित यादृच्छिक चर की सूची वाला एक डेटासेट तैयार किया है:
#install (if not already installed) and load tseries package if(!require(tseries)){install.packages('tseries')} #generate a list of 100 uniformly distributed random variables dataset <- runif(100) #conduct Jarque-Bera test jarque.bera.test(dataset)
यह निम्नलिखित आउटपुट उत्पन्न करता है:
यह हमें बताता है कि परीक्षण आँकड़ा 8.0807 है और परीक्षण पी-मान 0.01759 है। इस मामले में, हम उस शून्य परिकल्पना को अस्वीकार कर देंगे कि डेटा सामान्य रूप से वितरित किया जाता है। हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि इस उदाहरण में डेटा सामान्य रूप से वितरित नहीं है।
यह परिणाम आश्चर्यजनक नहीं होना चाहिए क्योंकि हमने जो डेटासेट तैयार किया है वह 100 यादृच्छिक चर से बना है जो एक समान वितरण का पालन करता है। आख़िरकार, डेटा का उद्देश्य समान रूप से वितरित करना है, सामान्य रूप से नहीं।