सतत और श्रेणीबद्ध चर के बीच सहसंबंध की गणना कैसे करें


जब हम दो सतत चरों के बीच सहसंबंध की गणना करना चाहते हैं, तो हम आम तौर पर पियर्सन सहसंबंध गुणांक का उपयोग करते हैं।

हालाँकि, जब हम एक सतत चर और एक श्रेणीगत चर के बीच सहसंबंध की गणना करना चाहते हैं, तो हम बिंदु द्विक्रमिक सहसंबंध का उपयोग कर सकते हैं।

बिंदु द्विक्रमिक सहसंबंध का उपयोग एक द्विआधारी श्रेणीबद्ध चर (एक चर जो केवल दो मान ले सकता है) और एक सतत चर के बीच सहसंबंध की गणना करने के लिए किया जाता है और इसमें निम्नलिखित गुण होते हैं:

  • बिंदु-द्विक्रमिक सहसंबंध -1 और 1 के बीच भिन्न हो सकता है।
  • बाइनरी वैरिएबल द्वारा बनाए गए प्रत्येक समूह के लिए, यह माना जाता है कि निरंतर वैरिएबल सामान्य रूप से समान भिन्नताओं के साथ वितरित किया जाता है।
  • बाइनरी वैरिएबल द्वारा बनाए गए प्रत्येक समूह के लिए, यह माना जाता है कि कोई चरम आउटलेर नहीं हैं।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में बिंदु-द्विक्रमिक सहसंबंध की गणना कैसे करें।

उदाहरण: बिंदु-द्विक्रमिक सहसंबंध की गणना

मान लीजिए कि एक विश्वविद्यालय प्रोफेसर यह निर्धारित करना चाहता है कि किसी विशेष योग्यता परीक्षा में लिंग और स्कोर के बीच कोई संबंध है या नहीं।

वह अपनी कक्षा में 12 लड़कों और 12 लड़कियों पर निम्नलिखित डेटा एकत्र करता है:

चूँकि लिंग एक श्रेणीबद्ध चर है और स्कोर एक सतत चर है, इसलिए दो चर के बीच एक बिंदु-द्विक्रमिक सहसंबंध की गणना करना समझ में आता है।

प्रोफेसर दो चर के बीच बिंदु-द्विक्रमिक सहसंबंध की गणना करने के लिए किसी भी सांख्यिकीय सॉफ्टवेयर (एक्सेल, आर, पायथन, एसपीएसएस, स्टाटा सहित) का उपयोग कर सकते हैं।

निम्नलिखित कोड दिखाता है कि लिंग चर के लिए महिलाओं का प्रतिनिधित्व करने के लिए मान 0 और पुरुषों का प्रतिनिधित्व करने के लिए 1 का उपयोग करके आर में बिंदु-द्विक्रमिक सहसंबंध की गणना कैसे करें:

 #define values for gender
gender <- c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
            1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1)

#define values for score
score <- c(77, 78, 79, 79, 82, 84, 85, 88, 89, 91, 91, 94,
           84, 84, 84, 85, 85, 86, 86, 86, 89, 91, 94, 98)

#calculate point-biserial correlation
horn. test (gender, score)

	Pearson's product-moment correlation

data: gender and score
t = 1.3739, df = 22, p-value = 0.1833
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.1379386 0.6147832
sample estimates:
      horn 
0.2810996

परिणाम से, हम देख सकते हैं कि बिंदु-द्विक्रमिक सहसंबंध गुणांक 0.281 है और संबंधित पी-मान 0.1833 है।

चूँकि सहसंबंध गुणांक सकारात्मक है, यह हमें बताता है कि लिंग और स्कोर के बीच सकारात्मक सहसंबंध है।

चूँकि हमने पुरुषों को 1 और महिलाओं को 0 के रूप में कोडित किया है, यह इंगित करता है कि पुरुषों के लिए स्कोर अधिक होते हैं (यानी, लिंग “बढ़ने” के साथ स्कोर बढ़ने लगते हैं)। » 0 से 1 तक).

हालाँकि, चूंकि पी-वैल्यू 0.05 से कम नहीं है, इसलिए यह सहसंबंध गुणांक सांख्यिकीय रूप से महत्वपूर्ण नहीं है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि विभिन्न सांख्यिकीय सॉफ़्टवेयर का उपयोग करके बिंदु द्विक्रमिक सहसंबंध की गणना कैसे करें:

एक्सेल में बिंदु-द्विक्रमिक सहसंबंध की गणना कैसे करें
आर में बिंदु-द्विक्रमिक सहसंबंध की गणना कैसे करें
पायथन में बिंदु-द्विक्रमिक सहसंबंध की गणना कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *