सांख्यिकी में सामान्यता की धारणा क्या है?


कई सांख्यिकीय परीक्षण सामान्यता धारणा कहलाने वाली चीज़ पर निर्भर करते हैं।

इस परिकल्पना में कहा गया है कि यदि हम किसी आबादी से कई स्वतंत्र यादृच्छिक नमूने एकत्र करते हैं और ब्याज के मूल्य (जैसे नमूना माध्य ) की गणना करते हैं, तो नमूना साधनों के वितरण की कल्पना करने के लिए एक हिस्टोग्राम बनाएं, हमें एक आदर्श घंटी वक्र का निरीक्षण करना चाहिए।

कई सांख्यिकीय तकनीकें डेटा के बारे में यह धारणा बनाती हैं, जिनमें शामिल हैं:

1. एक नमूना टी परीक्षण : यह माना जाता है कि नमूना डेटा सामान्य रूप से वितरित किया जाता है।

2. दो-नमूना टी-परीक्षण : यह माना जाता है कि दो नमूने सामान्य रूप से वितरित हैं।

3. एनोवा : यह माना जाता है कि मॉडल अवशेष सामान्य रूप से वितरित होते हैं।

4. रैखिक प्रतिगमन : यह माना जाता है कि मॉडल अवशेष सामान्य रूप से वितरित होते हैं।

यदि यह धारणा पूरी नहीं होती है, तो इन परीक्षणों के परिणाम अविश्वसनीय हो जाते हैं और हम डेटा नमूनों से निकाले गए अपने निष्कर्षों को समग्र जनसंख्या के लिए आत्मविश्वास से सामान्यीकृत करने में सक्षम नहीं होते हैं। यही कारण है कि यह जांचना महत्वपूर्ण है कि क्या यह परिकल्पना पूरी होती है।

यह जांचने के दो सामान्य तरीके हैं कि यह सामान्यता धारणा पूरी हुई है या नहीं:

1. सामान्यता की कल्पना करें

2. एक औपचारिक सांख्यिकीय परीक्षण करें

निम्नलिखित अनुभाग उन विशिष्ट ग्राफ़ों की व्याख्या करते हैं जिन्हें आप बना सकते हैं और विशिष्ट सांख्यिकीय परीक्षण जो आप सामान्यता की जांच के लिए कर सकते हैं।

सामान्यता की कल्पना करें

यह जांचने का एक त्वरित और अनौपचारिक तरीका है कि डेटा सेट सामान्य रूप से वितरित किया गया है या नहीं, हिस्टोग्राम या क्यूक्यू प्लॉट बनाना है।

1. हिस्टोग्राम

यदि डेटा सेट का हिस्टोग्राम मोटे तौर पर घंटी के आकार का है, तो यह संभावना है कि डेटा सामान्य रूप से वितरित किया जाता है।

2. क्यूक्यूलैंड

एक QQ प्लॉट, जिसका संक्षिप्त रूप “क्वांटाइल-क्वांटाइल” है, एक प्रकार का प्लॉट है जो x-अक्ष के साथ सैद्धांतिक क्वांटाइल प्रदर्शित करता है (यानी यदि आपका डेटा सामान्य वितरण का पालन करता है तो वह कहां होगा) और y-अक्ष के साथ नमूनों की मात्रा प्रदर्शित करता है। (यानी जहां आपका डेटा वास्तव में रहता है)।

यदि डेटा मान 45 डिग्री का कोण बनाते हुए लगभग सीधी रेखा का अनुसरण करते हैं, तो डेटा को सामान्य रूप से वितरित माना जाता है।

एक औपचारिक सांख्यिकीय परीक्षण करें

आप यह निर्धारित करने के लिए एक औपचारिक सांख्यिकीय परीक्षण भी कर सकते हैं कि डेटा सेट सामान्य रूप से वितरित है या नहीं।

यदि परीक्षण का पी-मान एक निश्चित स्तर के महत्व से नीचे है (जैसे कि α = 0.05), तो आपके पास यह कहने के लिए पर्याप्त सबूत हैं कि डेटा सामान्य रूप से वितरित नहीं है।

सामान्यता का परीक्षण करने के लिए आमतौर पर तीन सांख्यिकीय परीक्षण उपयोग किए जाते हैं:

1. जार्के-बेरा परीक्षण

2. शापिरो-विल्क परीक्षण

3. कोलमोगोरोव-स्मिरनोव परीक्षण

यदि सामान्यता की धारणा का उल्लंघन हो तो क्या करें?

यदि यह पता चलता है कि आपका डेटा सामान्य रूप से वितरित नहीं है, तो आपके पास दो विकल्प हैं:

1. डेटा परिवर्तित करें.

एक विकल्प यह है कि डेटा को अधिक सामान्य रूप से वितरित करने के लिए उसे रूपांतरित किया जाए । सामान्य परिवर्तनों में शामिल हैं:

  • लॉग ट्रांसफॉर्मेशन: डेटा को y से log(y) में बदलें।
  • वर्गमूल परिवर्तन: डेटा को y से √y में बदलें
  • घनमूल परिवर्तन: डेटा को y से y 1/3 में रूपांतरित करें
  • बॉक्स-कॉक्स परिवर्तन: बॉक्स-कॉक्स प्रक्रिया का उपयोग करके डेटा को रूपांतरित करें

इन परिवर्तनों को निष्पादित करने से, डेटा मानों का वितरण आम तौर पर अधिक सामान्य रूप से वितरित हो जाता है।

2. एक गैर-पैरामीट्रिक परीक्षण करें

सांख्यिकीय परीक्षण जो सामान्यता की धारणा बनाते हैं उन्हें पैरामीट्रिक परीक्षण कहा जाता है। लेकिन तथाकथित गैर-पैरामीट्रिक परीक्षणों का एक परिवार भी है जो सामान्यता की यह धारणा नहीं बनाता है।

यदि यह पता चलता है कि आपका डेटा सामान्य रूप से वितरित नहीं है, तो आप बस एक गैर-पैरामीट्रिक परीक्षण कर सकते हैं। यहां सामान्य सांख्यिकीय परीक्षणों के कुछ गैर-पैरामीट्रिक संस्करण दिए गए हैं:

पैरामीट्रिक परीक्षण गैर-पैरामीट्रिक समकक्ष
एक नमूना टी परीक्षण विलकॉक्सन द्वारा हस्ताक्षरित रैंक परीक्षण का एक नमूना
दो-नमूना टी-परीक्षण मान-व्हिटनी यू परीक्षण
युग्मित नमूने टी-परीक्षण विलकॉक्सन के दो नमूनों पर रैंक परीक्षण पर हस्ताक्षर किए गए
एक तरफ़ा एनोवा क्रुस्कल-वालिस परीक्षण

इनमें से प्रत्येक गैर-पैरामीट्रिक परीक्षण सामान्यता धारणा को संतुष्ट किए बिना एक सांख्यिकीय परीक्षण करना संभव बनाता है।

अतिरिक्त संसाधन

टी परीक्षण में चार परिकल्पनाएँ तैयार की गईं
रैखिक प्रतिगमन की चार धारणाएँ
एनोवा की चार परिकल्पनाएँ

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *