सह – संबंध
यह आलेख दो चरों के बीच सहसंबंध का अर्थ, सहसंबंध गुणांक की गणना कैसे करें, और मौजूद विभिन्न प्रकार के सहसंबंधों के बारे में बताता है। इसके अतिरिक्त, यह दिखाया गया है कि दो चरों के बीच सहसंबंध के मूल्य की व्याख्या कैसे की जाए।
सहसंबंध क्या है?
सहसंबंध एक सांख्यिकीय माप है जो दो चरों के बीच संबंध की डिग्री को इंगित करता है। अधिक विशेष रूप से, रैखिक सहसंबंध का उपयोग दो अलग-अलग चर के बीच रैखिक सहसंबंध की डिग्री निर्धारित करने के लिए किया जाता है।
दो वेरिएबल जुड़े होते हैं जब एक वेरिएबल का मान बदलने से दूसरे वेरिएबल का मान भी बदल जाता है। उदाहरण के लिए, यदि चर A को बढ़ाने से चर B भी बढ़ता है, तो चर A और B के बीच एक सहसंबंध होता है।
सहसंबंध के प्रकार
दो यादृच्छिक चर के बीच संबंध के आधार पर, निम्न प्रकार के रैखिक सहसंबंध प्रतिष्ठित हैं:
- प्रत्यक्ष सहसंबंध (या सकारात्मक सहसंबंध) : एक चर तब बढ़ता है जब दूसरा भी बढ़ता है।
- व्युत्क्रम सहसंबंध (या नकारात्मक सहसंबंध) : जब एक चर बढ़ता है, तो दूसरा घटता है, और इसके विपरीत, यदि एक चर घटता है, तो दूसरा बढ़ता है।
- शून्य सहसंबंध (कोई सहसंबंध नहीं) : दो चरों के बीच कोई संबंध नहीं है।
ध्यान रखें कि ये विभिन्न प्रकार के रैखिक सहसंबंध मौजूद हैं, लेकिन यह भी हो सकता है कि दो चर के बीच गणितीय संबंध को एक सीधी रेखा द्वारा दर्शाया नहीं जा सकता है, बल्कि इसके लिए एक दृष्टांत की तरह अधिक जटिल फ़ंक्शन का उपयोग करने की आवश्यकता है। या एक लघुगणक. इस मामले में, यह एक गैर-रैखिक सहसंबंध होगा।
सहसंबंध गुणांक
सहसंबंध की परिभाषा और मौजूद विभिन्न प्रकार के सहसंबंधों पर विचार करते हुए, आइए देखें कि इस सांख्यिकीय मान की गणना कैसे की जाती है।
सहसंबंध गुणांक , जिसे रैखिक सहसंबंध गुणांक या पियर्सन सहसंबंध गुणांक भी कहा जाता है, दो चर के बीच सहसंबंध का मान है।
दो सांख्यिकीय चरों का सहसंबंध गुणांक चरों के सहप्रसरण और प्रत्येक चर के प्रसरण के उत्पाद के वर्गमूल के बीच के भागफल के बराबर होता है। इसलिए, सहसंबंध गुणांक की गणना का सूत्र इस प्रकार है:
किसी जनसंख्या पर सहसंबंध गुणांक की गणना करते समय, सहसंबंध प्रतीक ग्रीक अक्षर ρ होता है। लेकिन जब किसी नमूने के सापेक्ष गुणांक की गणना की जाती है, तो अक्षर r आमतौर पर एक प्रतीक के रूप में उपयोग किया जाता है।
सहसंबंध सूचकांक का मान -1 और +1 सहित के बीच हो सकता है। हम नीचे देखेंगे कि सहसंबंध गुणांक के मूल्य की व्याख्या कैसे की जाती है।
सहसंबंध गुणांक की गणना कैसे की जाती है इसका एक ठोस उदाहरण आप निम्नलिखित लिंक में देख सकते हैं:
ध्यान रखें कि अन्य प्रकार के सहसंबंध गुणांक भी हैं, जैसे स्पीयरमैन या केंडल का सहसंबंध गुणांक। लेकिन सबसे आम निस्संदेह पियर्सन सहसंबंध गुणांक है।
सहसंबंध की व्याख्या करना
सहसंबंध गुणांक का मान -1 से लेकर +1 तक हो सकता है। तो, सहसंबंध गुणांक के मूल्य के आधार पर, इसका मतलब है कि दो चर के बीच संबंध एक दिशा या दूसरे में है। यहां सहसंबंध मूल्य की व्याख्या करने का तरीका बताया गया है:
- r=-1 : दो चरों का पूर्ण नकारात्मक सहसंबंध है, इसलिए हम एक नकारात्मक ढलान वाली एक रेखा खींच सकते हैं जिसमें सभी बिंदु जुड़ते हैं।
- -1<r<0 : दो चरों के बीच सहसंबंध नकारात्मक है, इसलिए जब एक चर बढ़ता है तो दूसरा घटता है। मान -1 के जितना करीब होगा, चर उतने ही अधिक नकारात्मक रूप से संबंधित होंगे।
- r=0 : दो चरों के बीच सहसंबंध बहुत कमजोर है, वास्तव में, उनके बीच रैखिक संबंध शून्य है। इसका मतलब यह नहीं है कि चर स्वतंत्र हैं, क्योंकि उनका गैर-रैखिक संबंध हो सकता है।
- 0<r<1 : दो चरों के बीच सहसंबंध सकारात्मक है, मान +1 के जितना करीब होगा, चरों के बीच संबंध उतना ही मजबूत होगा। इस मामले में, जब दूसरा भी बढ़ता है तो एक चर का मान बढ़ने लगता है।
- r=1 : दो चरों का पूर्ण सकारात्मक सहसंबंध है, अर्थात उनका सकारात्मक रैखिक संबंध है।

जैसा कि आप ऊपर दिए गए स्कैटरप्लॉट में देख सकते हैं, दो चरों के बीच सहसंबंध जितना मजबूत होगा, ग्राफ़ पर बिंदु उतने ही करीब होंगे। दूसरी ओर, यदि बिंदु बहुत दूर हैं, तो इसका मतलब है कि सहसंबंध कमजोर है।
ध्यान रखें कि यदि दो चरों के बीच सहसंबंध है, तो भी इसका मतलब यह नहीं है कि उनके बीच कार्य-कारण है, अर्थात दो चरों के बीच संबंध का मतलब यह नहीं है कि एक चर में परिवर्तन दूसरे में परिवर्तन का कारण है। चर।
उदाहरण के लिए, यदि हम पाते हैं कि शरीर में दो अलग-अलग हार्मोनों के उत्पादन के बीच सकारात्मक संबंध है, तो इसका मतलब यह नहीं है कि एक हार्मोन में वृद्धि से दूसरे हार्मोन में वृद्धि होती है। ऐसा हो सकता है कि शरीर दोनों हार्मोन का उत्पादन करता है क्योंकि उसे किसी बीमारी से लड़ने के लिए दोनों की आवश्यकता होती है और इसलिए दोनों का स्तर एक साथ बढ़ जाता है, ऐसी स्थिति में इसका कारण बीमारी होगी। यह निर्धारित करने के लिए कि क्या दोनों हार्मोनों के बीच कोई कारणात्मक संबंध है, अधिक विस्तृत अध्ययन किया जाना चाहिए।
सहसंबंध और प्रतिगमन
सहसंबंध और प्रतिगमन दो आम तौर पर संबंधित अवधारणाएं हैं, क्योंकि दोनों का उपयोग दो चर के बीच संबंध का विश्लेषण करने के लिए किया जाता है।
सहसंबंध एक सांख्यिकीय माप है जो दो चर के बीच संबंध को मापता है, हालांकि, प्रतिगमन में एक समीकरण बनाना शामिल है (यदि यह एक रैखिक प्रतिगमन है तो यह एक सीधी रेखा होगी) जो दो चर को संबंधित करने की अनुमति देता है।
इस प्रकार, सहसंबंध केवल चर के बीच संबंध के लिए एक संख्यात्मक मान प्रदान करता है, जबकि प्रतिगमन का उपयोग दूसरे के सापेक्ष एक चर के मूल्य की भविष्यवाणी करने का प्रयास करने के लिए किया जा सकता है।
आम तौर पर, हम सबसे पहले सहसंबंध गुणांक की गणना करके विश्लेषण करते हैं कि क्या चर सहसंबद्ध हैं। और यदि सहसंबंध महत्वपूर्ण है, तो हम डेटासेट का प्रतिगमन चलाते हैं।
रैखिक प्रतिगमन में प्राप्त रेखा के ढलान के मूल्य के साथ सहसंबंध गुणांक को भ्रमित करना आम बात है, हालांकि वे समकक्ष नहीं हैं।
सहसम्बंध मैट्रिक्स
सहसंबंध मैट्रिक्स एक मैट्रिक्स है जिसमें स्थिति i,j में चर i और j के बीच सहसंबंध गुणांक होता है।
इसलिए, सहसंबंध मैट्रिक्स एक वर्ग मैट्रिक्स है जो मुख्य विकर्ण पर लोगों से भरा होता है और पंक्ति i और कॉलम j के तत्व में चर i और चर j के बीच सहसंबंध गुणांक का मान होता है।
इस प्रकार, सहसंबंध मैट्रिक्स का सूत्र इस प्रकार है:

सोना
चरों के बीच सहसंबंध गुणांक है
और
सहसंबंध मैट्रिक्स परिणामों को सारांशित करने और एक ही समय में कई चर के बीच सहसंबंध की तुलना करने के लिए बहुत उपयोगी है, क्योंकि आप जल्दी से देख सकते हैं कि कौन से रिश्ते मजबूत हैं।