पायथन में सहसंबंध परीक्षण कैसे करें (उदाहरण के साथ)


दो चरों के बीच संबंध को मापने का एक तरीका पियर्सन सहसंबंध गुणांक का उपयोग करना है, जो दो चरों के बीच रैखिक संबंध को मापता है

यह हमेशा -1 और 1 के बीच मान लेता है जहां:

  • -1 पूर्णतः नकारात्मक रैखिक सहसंबंध दर्शाता है
  • 0 कोई रैखिक सहसंबंध नहीं दर्शाता है
  • 1 पूर्णतः सकारात्मक रैखिक सहसंबंध दर्शाता है

यह निर्धारित करने के लिए कि सहसंबंध गुणांक सांख्यिकीय रूप से महत्वपूर्ण है या नहीं, आप संबंधित टी-स्कोर और पी-वैल्यू की गणना कर सकते हैं।

सहसंबंध गुणांक (आर) के टी-स्कोर की गणना करने का सूत्र है:

टी = आर * √ एन-2 / √ 1-आर 2

फिर पी-वैल्यू की गणना स्वतंत्रता की एन-2 डिग्री के साथ टी-वितरण के लिए संबंधित दो-पूंछ वाले पी-वैल्यू के रूप में की जाती है।

उदाहरण: पायथन में सहसंबंध परीक्षण

यह निर्धारित करने के लिए कि क्या दो चर के बीच सहसंबंध गुणांक सांख्यिकीय रूप से महत्वपूर्ण है, आप SciPy लाइब्रेरी से पियर्सनआर फ़ंक्शन का उपयोग करके पायथन में सहसंबंध परीक्षण कर सकते हैं।

यह फ़ंक्शन दो चरों के साथ-साथ दो-पूंछ वाले पी-मान के बीच सहसंबंध गुणांक लौटाता है।

उदाहरण के लिए, मान लीजिए कि हमारे पास पायथन में निम्नलिखित दो तालिकाएँ हैं:

 #create two arrays
x = [3, 4, 4, 5, 7, 8, 10, 12, 13, 15]
y = [2, 4, 4, 5, 4, 7, 8, 19, 14, 10]

हम पियर्सन फ़ंक्शन को आयात कर सकते हैं और दो तालिकाओं के बीच पियर्सन सहसंबंध गुणांक की गणना कर सकते हैं:

 from scipy. stats . stats import pearsonr

#calculation correlation coefficient and p-value between x and y
pearsonr(x, y)

(0.8076177030748631, 0.004717255828132089)

यहां परिणाम की व्याख्या करने का तरीका बताया गया है:

  • पियर्सन सहसंबंध गुणांक (आर): 0.8076
  • दो-तरफा पी-मान: 0.0047

सहसंबंध गुणांक 1 के करीब है, यह हमें बताता है कि दो चर के बीच एक मजबूत सकारात्मक संबंध है।

और चूँकि संगत पी-मान 0.05 से कम है, हम यह निष्कर्ष निकालते हैं कि दोनों चरों के बीच सांख्यिकीय रूप से महत्वपूर्ण संबंध है।

ध्यान दें कि हम पियर्सन फ़ंक्शन से व्यक्तिगत सहसंबंध गुणांक और पी-मान भी निकाल सकते हैं:

 #extract correlation coefficient (rounded to 4 decimal places)
r = round(pearsonr(x, y)[ 0 ], 4)

print (r)

0.8076

#extract p-value (rounded to 4 decimal places) 
p = round(pearsonr(x, y)[ 1 ], 4)

print (p) 

0.0047

मूल पियर्सन फ़ंक्शन के आउटपुट की तुलना में इन मानों को पढ़ना थोड़ा आसान है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल सहसंबंध गुणांक के बारे में अतिरिक्त जानकारी प्रदान करते हैं:

पियर्सन सहसंबंध गुणांक का एक परिचय
“मजबूत” सहसंबंध क्या माना जाता है?
पियर्सन के सहसंबंध की पाँच परिकल्पनाएँ

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *