एकत्रीकरण पूर्वाग्रह क्या है? (स्पष्टीकरण एवं उदाहरण)


एकत्रीकरण पूर्वाग्रह तब होता है जब एकत्रित डेटा में देखे गए रुझानों को गलत तरीके से व्यक्तिगत डेटा बिंदुओं पर भी लागू माना जाता है।

इस प्रकार के पूर्वाग्रह को समझने का सबसे आसान तरीका एक सरल उदाहरण लेना है।

उदाहरण: एकत्रीकरण पूर्वाग्रह

मान लीजिए कि शोधकर्ता एक निश्चित राज्य में शिक्षा के औसत वर्षों और औसत घरेलू आय के बीच संबंध को समझना चाहते हैं। वे राज्य के 4 अलग-अलग शहरों के लिए समग्र डेटा प्राप्त करते हैं और औसत शिक्षा और औसत घरेलू आय के बीच संबंध की गणना करते हैं।

इससे पता चलता है कि शिक्षा के औसत वर्षों और औसत घरेलू आय के बीच संबंध 0.9632 है। यह एक बहुत ही सकारात्मक सहसंबंध गुणांक है.

शोधकर्ता शिक्षा के औसत वर्षों और औसत घरेलू आय के बीच संबंधों की कल्पना करने के लिए एक स्कैटरप्लॉट भी बनाते हैं:

वास्तव में व्यक्तिगत डेटा को देखे बिना, वे एक रिपोर्ट जारी कर सकते हैं जिसमें दावा किया गया है कि अधिक वर्षों की शिक्षा का घरेलू आय के साथ सकारात्मक संबंध है।

हालाँकि, मान लीजिए कि एक साल बाद एक नया शोधकर्ता आता है और शहरों के एक ही समूह में अलग-अलग घरों पर डेटा प्राप्त करता है। मान लीजिए कि वह डेटा का निम्नलिखित स्कैटरप्लॉट बनाती है:

एकत्रीकरण पूर्वाग्रह

वह दो चरों के बीच सहसंबंध की गणना करती है और पाती है कि यह वास्तव में केवल 0.1788 है – अभी भी एक सकारात्मक सहसंबंध है, लेकिन पिछले शोधकर्ताओं द्वारा पाए गए सहसंबंध जितना मजबूत नहीं है।

यह पता चला है कि जब डेटा एकत्र किया गया था, तो इसमें शिक्षा और आय के बीच की वास्तविक प्रवृत्ति को शामिल किया गया था जो व्यक्तिगत स्तर पर हो रही थी।

वास्तव में, जब हम स्कैटरप्लॉट में शहर-दर-शहर देखते हैं, तो शिक्षा और आय के बीच संबंध वास्तव में नकारात्मक होता है!

सांख्यिकी में एकत्रीकरण पूर्वाग्रह का उदाहरण

एकत्रीकरण पूर्वाग्रह के प्रभाव

अनुसंधान में एकत्रीकरण पूर्वाग्रह अक्सर होता है क्योंकि यह अक्सर गलत तरीके से मान लिया जाता है कि जो रुझान समग्र स्तर पर दिखाई देते हैं उन्हें व्यक्तिगत स्तर पर भी प्रकट होना चाहिए। दुर्भाग्य से, यह हमेशा मामला नहीं होता, जैसा कि पिछले उदाहरण से पता चलता है।

एकत्रीकरण पूर्वाग्रह के कारण अध्ययन के परिणाम गलत निष्कर्ष निकाल सकते हैं और भ्रामक हो सकते हैं। इस प्रकार का पूर्वाग्रह विशेष रूप से हानिकारक होता है जब यह चरों के बीच सहसंबंधों से संबंधित होता है।

भले ही दो चरों के समग्र डेटा के बीच सहसंबंध सकारात्मक हो, व्यक्तिगत अवलोकन के स्तर पर दो चरों के बीच अंतर्निहित सहसंबंध वास्तव में हो सकता है:

  • नकारात्मक सहसंबंध
  • कोई सह सम्बन्ध नहीं
  • सकारात्मक संबंध

इस प्रकार के पूर्वाग्रह से बचने का तरीका समग्र डेटा बिंदुओं के बजाय व्यक्तिगत डेटा बिंदुओं का उपयोग करके अध्ययन करना है ताकि आप दो चर के बीच सही संबंध की खोज कर सकें।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *