आर में बहुभिन्नरूपी सामान्यता परीक्षण कैसे करें


जब हम यह परीक्षण करना चाहते हैं कि एक एकल चर सामान्य रूप से वितरित है या नहीं, तो हम वितरण की कल्पना करने के लिए एक QQ प्लॉट बना सकते हैं या एंडरसन डार्लिंग परीक्षण या जर्क-बेरा परीक्षण जैसे औपचारिक सांख्यिकीय परीक्षण कर सकते हैं।

हालाँकि, जब हम यह परीक्षण करना चाहते हैं कि क्या एकाधिक चर सामान्य रूप से एक समूह के रूप में वितरित किए जाते हैं, तो हमें एक बहुभिन्नरूपी सामान्यता परीक्षण करने की आवश्यकता होती है।

यह ट्यूटोरियल बताता है कि आर में दिए गए डेटा सेट के लिए निम्नलिखित बहुभिन्नरूपी सामान्यता परीक्षण कैसे करें:

  • मार्डिया का परीक्षण
  • ऊर्जा परीक्षण
  • बहुभिन्नरूपी कुर्टोसिस और तिरछापन परीक्षण

संबंधित: यदि हम बहुभिन्नरूपी संदर्भ में आउटलेर्स की पहचान करना चाहते हैं, तो हम महालनोबिस दूरी का उपयोग कर सकते हैं।

उदाहरण: आर में मार्डिया का परीक्षण

मार्डिया परीक्षण यह निर्धारित करता है कि चर का एक समूह बहुभिन्नरूपी सामान्य वितरण का पालन करता है या नहीं। परीक्षण की शून्य और वैकल्पिक परिकल्पनाएँ इस प्रकार हैं:

एच 0 (शून्य): चर एक बहुभिन्नरूपी सामान्य वितरण का पालन करते हैं।

एच (वैकल्पिक): चर बहुभिन्नरूपी सामान्य वितरण का पालन नहीं करते हैं

निम्नलिखित कोड दिखाता है कि क्वांटसाइक पैकेज का उपयोग करके आर में यह परीक्षण कैसे किया जाए:

 library (QuantPsyc)

#create dataset
set.seed(0)

data <- data.frame(x1 = rnorm(50),
                   x2 = rnorm(50),
                   x3 = rnorm(50))

#perform Multivariate normality test
mult.norm(data)$ mult.test

Beta-hat kappa p-val
Skewness 1.630474 13.5872843 0.1926626
Kurtosis 13.895364 -0.7130395 0.4758213

मल्टी.नॉर्म() फ़ंक्शन डेटासेट के तिरछापन और कर्टोसिस दोनों में बहुभिन्नरूपी सामान्यता का परीक्षण करता है। चूँकि दोनों पी-मान 0.05 से कम नहीं हैं, हम परीक्षण की शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं। हमारे पास इस बात का कोई सबूत नहीं है कि हमारे डेटासेट में तीन चर बहुभिन्नरूपी वितरण का पालन नहीं करते हैं।

उदाहरण: आर में ऊर्जा परीक्षण

ऊर्जा परीक्षण एक अन्य सांख्यिकीय परीक्षण है जो यह निर्धारित करता है कि चर का एक समूह बहुभिन्नरूपी सामान्य वितरण का पालन करता है या नहीं। परीक्षण की शून्य और वैकल्पिक परिकल्पनाएँ इस प्रकार हैं:

एच 0 (शून्य): चर एक बहुभिन्नरूपी सामान्य वितरण का पालन करते हैं।

एच (वैकल्पिक): चर बहुभिन्नरूपी सामान्य वितरण का पालन नहीं करते हैं

निम्नलिखित कोड दिखाता है कि ऊर्जा पैकेज का उपयोग करके आर में यह परीक्षण कैसे किया जाए:

 library (energy)

#create dataset
set.seed(0)

data <- data.frame(x1 = rnorm(50),
                   x2 = rnorm(50),
                   x3 = rnorm(50))

#perform Multivariate normality test
mvnorm.etest(data, R= 100 )

Energy test of multivariate normality: estimated parameters

data: x, sample size 50, dimension 3, replicates 100
E-statistic = 0.90923, p-value = 0.31

परीक्षण का पी-मान 0.31 है। चूँकि यह आंकड़ा 0.05 से कम नहीं है, हम परीक्षण की शून्य परिकल्पना को अस्वीकार करने में विफल हैं। हमारे पास इस बात का कोई सबूत नहीं है कि हमारे डेटासेट में तीन चर बहुभिन्नरूपी वितरण का पालन नहीं करते हैं।

नोट: R=100 तर्क परीक्षण चलाते समय उपयोग करने के लिए 100 बूस्ट-मैप्ड प्रतिकृतियां निर्दिष्ट करता है। छोटे नमूना आकार वाले डेटा सेट के लिए, आप परीक्षण आंकड़ों का अधिक विश्वसनीय अनुमान तैयार करने के लिए इस संख्या को बढ़ा सकते हैं।

अतिरिक्त संसाधन

R में QQ प्लॉट कैसे बनाएं और उसकी व्याख्या कैसे करें
आर में एंडरसन-डार्लिंग परीक्षण कैसे करें
आर में जर्क-बेरा परीक्षण कैसे करें
आर में शापिरो-विल्क परीक्षण कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *