आर में बहुभिन्नरूपी सामान्यता परीक्षण कैसे करें
जब हम यह परीक्षण करना चाहते हैं कि एक एकल चर सामान्य रूप से वितरित है या नहीं, तो हम वितरण की कल्पना करने के लिए एक QQ प्लॉट बना सकते हैं या एंडरसन डार्लिंग परीक्षण या जर्क-बेरा परीक्षण जैसे औपचारिक सांख्यिकीय परीक्षण कर सकते हैं।
हालाँकि, जब हम यह परीक्षण करना चाहते हैं कि क्या एकाधिक चर सामान्य रूप से एक समूह के रूप में वितरित किए जाते हैं, तो हमें एक बहुभिन्नरूपी सामान्यता परीक्षण करने की आवश्यकता होती है।
यह ट्यूटोरियल बताता है कि आर में दिए गए डेटा सेट के लिए निम्नलिखित बहुभिन्नरूपी सामान्यता परीक्षण कैसे करें:
- मार्डिया का परीक्षण
- ऊर्जा परीक्षण
- बहुभिन्नरूपी कुर्टोसिस और तिरछापन परीक्षण
संबंधित: यदि हम बहुभिन्नरूपी संदर्भ में आउटलेर्स की पहचान करना चाहते हैं, तो हम महालनोबिस दूरी का उपयोग कर सकते हैं।
उदाहरण: आर में मार्डिया का परीक्षण
मार्डिया परीक्षण यह निर्धारित करता है कि चर का एक समूह बहुभिन्नरूपी सामान्य वितरण का पालन करता है या नहीं। परीक्षण की शून्य और वैकल्पिक परिकल्पनाएँ इस प्रकार हैं:
एच 0 (शून्य): चर एक बहुभिन्नरूपी सामान्य वितरण का पालन करते हैं।
एच ए (वैकल्पिक): चर बहुभिन्नरूपी सामान्य वितरण का पालन नहीं करते हैं ।
निम्नलिखित कोड दिखाता है कि क्वांटसाइक पैकेज का उपयोग करके आर में यह परीक्षण कैसे किया जाए:
library (QuantPsyc) #create dataset set.seed(0) data <- data.frame(x1 = rnorm(50), x2 = rnorm(50), x3 = rnorm(50)) #perform Multivariate normality test mult.norm(data)$ mult.test Beta-hat kappa p-val Skewness 1.630474 13.5872843 0.1926626 Kurtosis 13.895364 -0.7130395 0.4758213
मल्टी.नॉर्म() फ़ंक्शन डेटासेट के तिरछापन और कर्टोसिस दोनों में बहुभिन्नरूपी सामान्यता का परीक्षण करता है। चूँकि दोनों पी-मान 0.05 से कम नहीं हैं, हम परीक्षण की शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं। हमारे पास इस बात का कोई सबूत नहीं है कि हमारे डेटासेट में तीन चर बहुभिन्नरूपी वितरण का पालन नहीं करते हैं।
उदाहरण: आर में ऊर्जा परीक्षण
ऊर्जा परीक्षण एक अन्य सांख्यिकीय परीक्षण है जो यह निर्धारित करता है कि चर का एक समूह बहुभिन्नरूपी सामान्य वितरण का पालन करता है या नहीं। परीक्षण की शून्य और वैकल्पिक परिकल्पनाएँ इस प्रकार हैं:
एच 0 (शून्य): चर एक बहुभिन्नरूपी सामान्य वितरण का पालन करते हैं।
एच ए (वैकल्पिक): चर बहुभिन्नरूपी सामान्य वितरण का पालन नहीं करते हैं ।
निम्नलिखित कोड दिखाता है कि ऊर्जा पैकेज का उपयोग करके आर में यह परीक्षण कैसे किया जाए:
library (energy) #create dataset set.seed(0) data <- data.frame(x1 = rnorm(50), x2 = rnorm(50), x3 = rnorm(50)) #perform Multivariate normality test mvnorm.etest(data, R= 100 ) Energy test of multivariate normality: estimated parameters data: x, sample size 50, dimension 3, replicates 100 E-statistic = 0.90923, p-value = 0.31
परीक्षण का पी-मान 0.31 है। चूँकि यह आंकड़ा 0.05 से कम नहीं है, हम परीक्षण की शून्य परिकल्पना को अस्वीकार करने में विफल हैं। हमारे पास इस बात का कोई सबूत नहीं है कि हमारे डेटासेट में तीन चर बहुभिन्नरूपी वितरण का पालन नहीं करते हैं।
नोट: R=100 तर्क परीक्षण चलाते समय उपयोग करने के लिए 100 बूस्ट-मैप्ड प्रतिकृतियां निर्दिष्ट करता है। छोटे नमूना आकार वाले डेटा सेट के लिए, आप परीक्षण आंकड़ों का अधिक विश्वसनीय अनुमान तैयार करने के लिए इस संख्या को बढ़ा सकते हैं।
अतिरिक्त संसाधन
R में QQ प्लॉट कैसे बनाएं और उसकी व्याख्या कैसे करें
आर में एंडरसन-डार्लिंग परीक्षण कैसे करें
आर में जर्क-बेरा परीक्षण कैसे करें
आर में शापिरो-विल्क परीक्षण कैसे करें