पायथन में बहुभिन्नरूपी सामान्यता परीक्षण कैसे करें


जब हम यह परीक्षण करना चाहते हैं कि कोई एकल चर सामान्य रूप से वितरित है या नहीं, तो हम एक बना सकते हैं   वितरण की कल्पना करने के लिए QQ प्लॉट या हम एंडरसन डार्लिंग परीक्षण या जर्क-बेरा परीक्षण जैसे औपचारिक सांख्यिकीय परीक्षण कर सकते हैं

हालाँकि, जब हम यह परीक्षण करना चाहते हैं कि क्या एकाधिक चर सामान्य रूप से एक समूह के रूप में वितरित किए जाते हैं, तो हमें एक बहुभिन्नरूपी सामान्यता परीक्षण करने की आवश्यकता होती है।

यह ट्यूटोरियल बताता है कि पायथन में दिए गए डेटासेट के लिए हेन्ज़-ज़िर्कलर मल्टीवेरिएट सामान्यता परीक्षण कैसे करें।

संबंधित: यदि हम बहुभिन्नरूपी संदर्भ में आउटलेर्स की पहचान करना चाहते हैं, तो हम महालनोबिस दूरी का उपयोग कर सकते हैं

उदाहरण: पायथन में हेन्ज़-ज़िर्कलर बहुभिन्नरूपी सामान्यता परीक्षण

हेन्ज़-ज़िर्कलर बहुभिन्नरूपी सामान्यता परीक्षण यह निर्धारित करता है कि चर का एक समूह बहुभिन्नरूपी सामान्य वितरण का पालन करता है या नहीं। परीक्षण की शून्य और वैकल्पिक परिकल्पनाएँ इस प्रकार हैं:

एच 0 (शून्य): चर एक बहुभिन्नरूपी सामान्य वितरण का पालन करते हैं।

एच (वैकल्पिक): चर बहुभिन्नरूपी सामान्य वितरण का पालन नहीं करते हैं

पायथन में इस परीक्षण को करने के लिए हम पेंगुइन लाइब्रेरी से मल्टीवेरिएट_नॉर्मलिटी () फ़ंक्शन का उपयोग कर सकते हैं।

सबसे पहले, हमें पेंगुइन स्थापित करना होगा:

 pip install penguin

इसके बाद, हम मल्टीवेरिएट_नॉर्मलिटी () फ़ंक्शन को आयात कर सकते हैं और किसी दिए गए डेटा सेट के लिए मल्टीवेरिएट नॉर्मलिटी टेस्ट करने के लिए इसका उपयोग कर सकते हैं:

 #import necessary packages
from penguin import multivariate_normality
import pandas as pd
import numpy as np

#create a dataset with three variables x1, x2, and x3
df = pd.DataFrame({'x1':np.random.normal(size= 50 ),
                   'x2': np.random.normal(size= 50 ),
                   'x3': np.random.normal(size= 50 )})

#perform the Henze-Zirkler Multivariate Normality Test
multivariate_normality(df, alpha= .05 )

HZResults(hz=0.5956866563391165, pval=0.6461804077893423, normal=True)

परीक्षण के परिणाम इस प्रकार हैं:

  • परीक्षण आँकड़ा हर्ट्ज: 0.59569
  • पी-वैल्यू: 0.64618

चूँकि परीक्षण का पी-मान हमारे निर्दिष्ट अल्फा मान 0.05 से कम नहीं है, हम शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं। डेटासेट को बहुभिन्नरूपी सामान्य वितरण का पालन करने वाला माना जा सकता है।

संबंधित: इस शोध पत्र में जानें कि वास्तविक दुनिया के चिकित्सा अनुप्रयोगों में हेन्ज़-ज़िर्कलर परीक्षण का उपयोग कैसे किया जाता है।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *