पायथन में बहुभिन्नरूपी सामान्यता परीक्षण कैसे करें
जब हम यह परीक्षण करना चाहते हैं कि कोई एकल चर सामान्य रूप से वितरित है या नहीं, तो हम एक बना सकते हैं वितरण की कल्पना करने के लिए QQ प्लॉट या हम एंडरसन डार्लिंग परीक्षण या जर्क-बेरा परीक्षण जैसे औपचारिक सांख्यिकीय परीक्षण कर सकते हैं ।
हालाँकि, जब हम यह परीक्षण करना चाहते हैं कि क्या एकाधिक चर सामान्य रूप से एक समूह के रूप में वितरित किए जाते हैं, तो हमें एक बहुभिन्नरूपी सामान्यता परीक्षण करने की आवश्यकता होती है।
यह ट्यूटोरियल बताता है कि पायथन में दिए गए डेटासेट के लिए हेन्ज़-ज़िर्कलर मल्टीवेरिएट सामान्यता परीक्षण कैसे करें।
संबंधित: यदि हम बहुभिन्नरूपी संदर्भ में आउटलेर्स की पहचान करना चाहते हैं, तो हम महालनोबिस दूरी का उपयोग कर सकते हैं ।
उदाहरण: पायथन में हेन्ज़-ज़िर्कलर बहुभिन्नरूपी सामान्यता परीक्षण
हेन्ज़-ज़िर्कलर बहुभिन्नरूपी सामान्यता परीक्षण यह निर्धारित करता है कि चर का एक समूह बहुभिन्नरूपी सामान्य वितरण का पालन करता है या नहीं। परीक्षण की शून्य और वैकल्पिक परिकल्पनाएँ इस प्रकार हैं:
एच 0 (शून्य): चर एक बहुभिन्नरूपी सामान्य वितरण का पालन करते हैं।
एच ए (वैकल्पिक): चर बहुभिन्नरूपी सामान्य वितरण का पालन नहीं करते हैं ।
पायथन में इस परीक्षण को करने के लिए हम पेंगुइन लाइब्रेरी से मल्टीवेरिएट_नॉर्मलिटी () फ़ंक्शन का उपयोग कर सकते हैं।
सबसे पहले, हमें पेंगुइन स्थापित करना होगा:
pip install penguin
इसके बाद, हम मल्टीवेरिएट_नॉर्मलिटी () फ़ंक्शन को आयात कर सकते हैं और किसी दिए गए डेटा सेट के लिए मल्टीवेरिएट नॉर्मलिटी टेस्ट करने के लिए इसका उपयोग कर सकते हैं:
#import necessary packages from penguin import multivariate_normality import pandas as pd import numpy as np #create a dataset with three variables x1, x2, and x3 df = pd.DataFrame({'x1':np.random.normal(size= 50 ), 'x2': np.random.normal(size= 50 ), 'x3': np.random.normal(size= 50 )}) #perform the Henze-Zirkler Multivariate Normality Test multivariate_normality(df, alpha= .05 ) HZResults(hz=0.5956866563391165, pval=0.6461804077893423, normal=True)
परीक्षण के परिणाम इस प्रकार हैं:
- परीक्षण आँकड़ा हर्ट्ज: 0.59569
- पी-वैल्यू: 0.64618
चूँकि परीक्षण का पी-मान हमारे निर्दिष्ट अल्फा मान 0.05 से कम नहीं है, हम शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं। डेटासेट को बहुभिन्नरूपी सामान्य वितरण का पालन करने वाला माना जा सकता है।
संबंधित: इस शोध पत्र में जानें कि वास्तविक दुनिया के चिकित्सा अनुप्रयोगों में हेन्ज़-ज़िर्कलर परीक्षण का उपयोग कैसे किया जाता है।