सांख्यिकी में समान विचरण की धारणा क्या है?
कई सांख्यिकीय परीक्षण समान भिन्नता की धारणा बनाते हैं। यदि इस धारणा का सम्मान नहीं किया जाता है, तो परीक्षण के परिणाम अविश्वसनीय हो जाते हैं।
सबसे आम सांख्यिकीय परीक्षण और प्रक्रियाएं जो समान भिन्नता की धारणा बनाती हैं उनमें शामिल हैं:
1. एनोवा
2. टी-परीक्षण
3. रेखीय प्रतिगमन
यह ट्यूटोरियल प्रत्येक परीक्षण के लिए बनाई गई धारणा को समझाता है, यह कैसे निर्धारित किया जाए कि वह धारणा पूरी होती है या नहीं, और यदि इसका उल्लंघन होता है तो क्या करें।
एनोवा में विचरण की समानता की धारणा
एक एनोवा (“विचरण का विश्लेषण”) का उपयोग यह निर्धारित करने के लिए किया जाता है कि तीन या अधिक स्वतंत्र समूहों के साधनों के बीच महत्वपूर्ण अंतर है या नहीं।
यहां एक उदाहरण दिया गया है कि हम एनोवा का उपयोग कब कर सकते हैं:
मान लीजिए कि हम वजन घटाने के प्रयोग में भाग लेने के लिए 90 लोगों की भर्ती करते हैं। हम यादृच्छिक रूप से 30 लोगों को एक महीने के लिए प्रोग्राम ए, बी, या सी का उपयोग करने के लिए नियुक्त करते हैं।
यह देखने के लिए कि क्या कार्यक्रम का वजन घटाने पर प्रभाव पड़ता है, हम एक-तरफ़ा एनोवा प्रदर्शन कर सकते हैं।
एनोवा मानता है कि प्रत्येक समूह में समान भिन्नता है। यह परिकल्पना सत्य है या नहीं, इसका परीक्षण करने के दो तरीके हैं:
1. बॉक्स प्लॉट बनाएं.
बॉक्सप्लॉट भिन्नताओं की समानता की धारणा को सत्यापित करने के लिए एक दृश्य तरीका प्रदान करते हैं।
प्रत्येक समूह में वजन घटाने में भिन्नता को प्रत्येक बॉक्सप्लॉट की लंबाई से देखा जा सकता है। बॉक्स जितना लंबा होगा, विचरण उतना ही अधिक होगा। उदाहरण के लिए, हम देख सकते हैं कि प्रोग्राम ए और प्रोग्राम बी की तुलना में प्रोग्राम सी में प्रतिभागियों के लिए भिन्नता थोड़ी अधिक है।
2. बार्टलेट परीक्षण करें.
बार्टलेट परीक्षण शून्य परिकल्पना का परीक्षण करता है कि नमूनों में समान भिन्नताएं हैं जबकि वैकल्पिक परिकल्पना है कि नमूनों में समान भिन्नताएं नहीं हैं।
यदि परीक्षण का पी-मान एक निश्चित स्तर के महत्व (जैसे 0.05) से नीचे है, तो हमारे पास सबूत है कि सभी नमूनों में समान भिन्नताएं नहीं हैं।
यदि समान विचरण की धारणा पूरी नहीं होती तो क्या होता है?
सामान्य तौर पर, जब तक प्रत्येक समूह का नमूना आकार समान होता है, तब तक एनोवा को समान भिन्नताओं की धारणा के उल्लंघन के खिलाफ काफी मजबूत माना जाता है।
हालाँकि, यदि नमूना आकार समान नहीं हैं और इस धारणा का गंभीर रूप से उल्लंघन किया गया है, तो आप इसके बजाय क्रुस्कल-वालिस परीक्षण चला सकते हैं, जो एक-तरफ़ा एनोवा का गैर-पैरामीट्रिक संस्करण है।
टी-परीक्षणों में समान विचरण की धारणा
दो-नमूना टी-परीक्षण का उपयोग यह जांचने के लिए किया जाता है कि दो आबादी के साधन बराबर हैं या नहीं।
परीक्षण मानता है कि दोनों समूहों के बीच भिन्नताएं बराबर हैं। यह परिकल्पना सत्य है या नहीं, इसका परीक्षण करने के दो तरीके हैं:
1. अनुपात नियम का प्रयोग करें।
आम तौर पर, यदि सबसे बड़े भिन्नता और सबसे छोटे भिन्नता का अनुपात 4 से कम है, तो हम मान सकते हैं कि भिन्नताएं लगभग बराबर हैं और दो-नमूना टी-टेस्ट का उपयोग करें।
उदाहरण के लिए, मान लें कि नमूना 1 में 24.5 का भिन्नता है और नमूना 2 में 15.2 का भिन्नता है। सबसे बड़े नमूना भिन्नता और सबसे छोटे नमूना भिन्नता के अनुपात की गणना इस प्रकार की जाएगी: 24.5 / 15.2 = 1.61।
यह अनुपात 4 से कम होने के कारण, कोई यह मान सकता है कि दोनों समूहों के बीच अंतर लगभग बराबर है।
2. एफ-परीक्षण करें।
एफ-परीक्षण शून्य परिकल्पना का परीक्षण करता है कि नमूनों में समान भिन्नताएं हैं जबकि वैकल्पिक परिकल्पना है कि नमूनों में समान भिन्नताएं नहीं हैं।
यदि परीक्षण का पी-मान एक निश्चित स्तर के महत्व (जैसे 0.05) से नीचे है, तो हमारे पास सबूत है कि सभी नमूनों में समान भिन्नताएं नहीं हैं।
यदि समान विचरण की धारणा पूरी नहीं होती तो क्या होता है?
यदि इस धारणा का उल्लंघन किया जाता है, तो हम वेल्च का टी-परीक्षण कर सकते हैं, जो दो-नमूना टी-परीक्षण का एक गैर-पैरामीट्रिक संस्करण है और यह नहीं मानता है कि दोनों नमूनों में समान भिन्नताएं हैं।
रेखीय प्रतिगमन में समान प्रसरण अनुमान
रैखिक प्रतिगमन का उपयोग एक या अधिक भविष्यवक्ता चर और एक प्रतिक्रिया चर के बीच संबंध को मापने के लिए किया जाता है।
रैखिक प्रतिगमन मानता है कि भविष्यवक्ता चर के प्रत्येक स्तर पर अवशेषों में निरंतर भिन्नता होती है। इसे होमोसेडैस्टिसिटी कहा जाता है। जब ऐसा नहीं होता है, तो अवशेष विषमलैंगिकता से ग्रस्त हो जाते हैं और प्रतिगमन विश्लेषण के परिणाम अविश्वसनीय हो जाते हैं।
यह निर्धारित करने का सबसे आम तरीका है कि यह धारणा पूरी हुई है या नहीं, अवशिष्ट बनाम फिट किए गए मानों का एक प्लॉट बनाना है। यदि इस ग्राफ़ में अवशेष शून्य के आसपास बेतरतीब ढंग से बिखरे हुए प्रतीत होते हैं, तो संभवतः समरूपता की धारणा पूरी हो जाती है।
हालाँकि, यदि अवशेषों में एक व्यवस्थित प्रवृत्ति है, जैसे कि निम्नलिखित ग्राफ में “शंकु” आकार, तो विषमलैंगिकता एक समस्या है:
यदि समान विचरण की धारणा पूरी नहीं होती तो क्या होता है?
यदि इस धारणा का उल्लंघन किया जाता है, तो समस्या को हल करने का सबसे आम तरीका तीन परिवर्तनों में से एक का उपयोग करके प्रतिक्रिया चर को बदलना है:
1. लॉग परिवर्तन: प्रतिक्रिया चर को y से log(y) में बदलें।
2. वर्गमूल परिवर्तन: प्रतिक्रिया चर को y से √y में बदलें।
3. घनमूल परिवर्तन: प्रतिक्रिया चर को y से y 1/3 में बदलें।
इन परिवर्तनों को निष्पादित करने से, विषमलैंगिकता की समस्या आम तौर पर गायब हो जाती है।
विषमलैंगिकता को ठीक करने का दूसरा तरीका भारित न्यूनतम वर्ग प्रतिगमन का उपयोग करना है। इस प्रकार का प्रतिगमन प्रत्येक डेटा बिंदु को उसके फिट किए गए मान के भिन्नता के आधार पर एक भार प्रदान करता है।
अनिवार्य रूप से, यह उन डेटा बिंदुओं को कम महत्व देता है जिनमें अधिक भिन्नताएं होती हैं, जिससे उनके अवशिष्ट वर्ग कम हो जाते हैं। जब उचित वजन का उपयोग किया जाता है, तो यह विषमलैंगिकता की समस्या को समाप्त कर सकता है।
अतिरिक्त संसाधन
तीन परिकल्पनाएँ एनोवा में तैयार की गईं
टी परीक्षण में चार परिकल्पनाएँ तैयार की गईं
रैखिक प्रतिगमन की चार धारणाएँ