सांख्यिकी में स्वतंत्रता की धारणा क्या है?


कई सांख्यिकीय परीक्षण मानते हैं कि अवलोकन स्वतंत्र हैं। इसका मतलब यह है कि डेटा सेट में कोई भी अवलोकन एक-दूसरे से संबंधित नहीं हैं या किसी भी तरह से एक-दूसरे को प्रभावित नहीं करते हैं।

उदाहरण के लिए, मान लें कि हम परीक्षण करना चाहते हैं कि बिल्लियों की दो प्रजातियों के बीच औसत वजन में अंतर है या नहीं। यदि हमने प्रजाति ए की 10 बिल्लियों और प्रजाति बी की 10 बिल्लियों का वजन मापा, तो हम स्वतंत्रता की धारणा का उल्लंघन करेंगे यदि बिल्लियों का प्रत्येक समूह एक ही कूड़े से आया हो।

यह संभव है कि प्रजाति ए की माँ बिल्ली के सभी बिल्ली के बच्चे कम वजन के थे जबकि प्रजाति बी की माँ बिल्ली के बिल्ली के बच्चे भारी थे। इस संबंध में, प्रत्येक नमूने के अवलोकन एक दूसरे से स्वतंत्र नहीं हैं।

तीन सामान्य प्रकार के सांख्यिकीय परीक्षण हैं जो स्वतंत्रता की यह धारणा बनाते हैं:

1. दो-नमूना टी-परीक्षण

2. एनोवा (विचरण का विश्लेषण)

3. रेखीय प्रतिगमन

निम्नलिखित अनुभागों में, हम बताते हैं कि प्रत्येक प्रकार के परीक्षण के लिए यह धारणा क्यों बनाई जाती है और साथ ही यह कैसे निर्धारित किया जाए कि यह धारणा पूरी होती है या नहीं।

टी-परीक्षणों में स्वतंत्रता की धारणा

दो-नमूना टी-परीक्षण का उपयोग यह जांचने के लिए किया जाता है कि दो आबादी के साधन बराबर हैं या नहीं।

धारणा: इस प्रकार का परीक्षण मानता है कि प्रत्येक नमूने के भीतर अवलोकन एक दूसरे से स्वतंत्र हैं और नमूनों के बीच के अवलोकन भी एक दूसरे से स्वतंत्र हैं।

इस परिकल्पना का परीक्षण करें: इस परिकल्पना का परीक्षण करने का सबसे सरल तरीका यह सत्यापित करना है कि प्रत्येक नमूने में प्रत्येक अवलोकन केवल एक बार दिखाई देता है और प्रत्येक नमूने में अवलोकन यादृच्छिक नमूने द्वारा एकत्र किए गए थे।

एनोवा में स्वतंत्रता धारणा

एनोवा का उपयोग यह निर्धारित करने के लिए किया जाता है कि तीन या अधिक स्वतंत्र समूहों के साधनों के बीच महत्वपूर्ण अंतर है या नहीं।

धारणा: एक एनोवा मानता है कि प्रत्येक समूह में अवलोकन एक दूसरे से स्वतंत्र हैं और समूहों के भीतर अवलोकन एक यादृच्छिक नमूने द्वारा प्राप्त किए गए थे।

इस परिकल्पना का परीक्षण करें: टी-परीक्षण के समान, इस परिकल्पना का परीक्षण करने का सबसे सरल तरीका यह सत्यापित करना है कि प्रत्येक नमूने में प्रत्येक अवलोकन केवल एक बार दिखाई देता है और प्रत्येक नमूने में अवलोकन यादृच्छिक नमूने द्वारा एकत्र किए गए थे।

कल्पित प्रतिगमन में स्वतंत्रता

रैखिक प्रतिगमन का उपयोग एक या अधिक भविष्यवक्ता चर और एक प्रतिक्रिया चर के बीच संबंध को समझने के लिए किया जाता है।

धारणा: रैखिक प्रतिगमन मानता है कि फिट किए गए मॉडल के अवशेष स्वतंत्र हैं।

इस परिकल्पना का परीक्षण करें: इस परिकल्पना का परीक्षण करने का सबसे आसान तरीका अवशेषों की एक समय श्रृंखला की साजिश को देखना है, जो समय बनाम अवशेषों की एक साजिश है। आदर्श रूप से, अधिकांश अवशिष्ट ऑटोसहसंबंध शून्य के आसपास 95% विश्वास बैंड के भीतर आने चाहिए, जो n के वर्गमूल पर लगभग +/- 2 स्थित हैं, जहां n नमूना आकार है। आप औपचारिक रूप से यह भी परीक्षण कर सकते हैं कि डर्बिन-वाटसन परीक्षण का उपयोग करके यह धारणा पूरी होती है या नहीं।

गैर-स्वतंत्रता के सामान्य स्रोत

डेटासेट में गैर-स्वतंत्रता के तीन सामान्य स्रोत हैं:

1. प्रेक्षण समय में एक साथ बंद हो जाते हैं।

उदाहरण के लिए, एक शोधकर्ता किसी निश्चित सड़क पर कारों की औसत गति पर डेटा एकत्र कर सकता है। यदि वह शाम को गति ट्रैक करना चुनता है, तो उसे पता चल सकता है कि औसत गति उसकी अपेक्षा से कहीं अधिक है, क्योंकि प्रत्येक ड्राइवर काम से घर भाग रहा है।

ये डेटा इस धारणा का उल्लंघन करते हैं कि प्रत्येक अवलोकन स्वतंत्र है। चूँकि प्रत्येक अवलोकन दिन के एक ही समय में देखा गया था, इसलिए प्रत्येक कार की गति समान होने की संभावना है।

2. प्रेक्षण अंतरिक्ष में एक साथ बंद हैं।

उदाहरण के लिए, एक शोधकर्ता उन लोगों से वार्षिक आय डेटा एकत्र कर सकता है जो एक ही उच्च आय वाले पड़ोस में रहते हैं क्योंकि यह सुविधाजनक है।

इस संबंध में, डेटा नमूने में शामिल सभी लोगों की आय समान होने की संभावना है क्योंकि वे सभी एक-दूसरे के करीब रहते हैं। यह इस धारणा का उल्लंघन करता है कि प्रत्येक अवलोकन स्वतंत्र है।

3. अवलोकन एक ही डेटासेट में कई बार दिखाई देते हैं।

उदाहरण के लिए, एक शोधकर्ता को 50 व्यक्तियों पर डेटा एकत्र करने की आवश्यकता हो सकती है, लेकिन इसके बजाय वह 25 व्यक्तियों पर दो बार डेटा एकत्र करने का निर्णय लेता है क्योंकि ऐसा करना बहुत आसान है।

यह स्वतंत्रता धारणा का उल्लंघन करता है क्योंकि डेटासेट में प्रत्येक अवलोकन स्वयं से संबंधित होगा।

स्वतंत्रता की धारणा का उल्लंघन करने से कैसे बचें?

स्वतंत्रता की धारणा का उल्लंघन करने से बचने का सबसे सरल तरीका जनसंख्या से नमूना प्राप्त करते समय सरल यादृच्छिक नमूनाकरण का उपयोग करना है।

इस पद्धति का उपयोग करते हुए, रुचि की आबादी में प्रत्येक व्यक्ति को नमूने में शामिल होने का समान मौका मिलता है।

उदाहरण के लिए, यदि हमारी रुचि की जनसंख्या में 10,000 व्यक्ति शामिल हैं, तो हम जनसंख्या में प्रत्येक व्यक्ति को यादृच्छिक रूप से एक संख्या निर्दिष्ट कर सकते हैं और फिर 40 यादृच्छिक संख्याओं का चयन करने के लिए एक यादृच्छिक संख्या जनरेटर का उपयोग कर सकते हैं। फिर इन नंबरों से मेल खाने वाले व्यक्तियों को नमूने में शामिल किया जाएगा।

इस पद्धति का उपयोग करके, हम दो व्यक्तियों को चुनने की संभावना को कम कर देते हैं जो एक-दूसरे के बहुत करीब हो सकते हैं या जो किसी तरह से संबंधित हो सकते हैं।

यह अन्य नमूनाकरण विधियों के बिल्कुल विपरीत है जैसे:

  • सुविधा नमूनाकरण: एक नमूने में ऐसे व्यक्तियों को शामिल करना जिन तक पहुंचना आसान है।
  • स्वैच्छिक नमूनाकरण: नमूने में ऐसे व्यक्तियों को शामिल करना जो स्वेच्छा से शामिल होना चाहते हैं।

यादृच्छिक नमूनाकरण पद्धति का उपयोग करके, हम स्वतंत्रता धारणा के उल्लंघन की संभावना को कम कर सकते हैं।

अतिरिक्त संसाधन

टी परीक्षण में चार परिकल्पनाएँ तैयार की गईं
रैखिक प्रतिगमन की चार धारणाएँ
एनोवा की तीन परिकल्पनाएँ
प्रतिनिधि नमूना क्या है और यह महत्वपूर्ण क्यों है?

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *