पायथन में परिकल्पना परीक्षण कैसे करें (उदाहरण के साथ)


परिकल्पना परीक्षण एक औपचारिक सांख्यिकीय परीक्षण है जिसका उपयोग हम सांख्यिकीय परिकल्पना को अस्वीकार करने या विफल करने के लिए करते हैं।

यह ट्यूटोरियल बताता है कि पायथन में निम्नलिखित परिकल्पना परीक्षण कैसे करें:

  • एक नमूना टी परीक्षण
  • दो-नमूना टी-परीक्षण
  • युग्मित नमूने टी-परीक्षण

चल दर!

उदाहरण 1: पायथन में टी-टेस्ट का एक उदाहरण

एक-नमूना टी-परीक्षण का उपयोग यह जांचने के लिए किया जाता है कि किसी जनसंख्या का माध्य एक निश्चित मूल्य के बराबर है या नहीं।

उदाहरण के लिए, मान लें कि हम जानना चाहते हैं कि कछुए की एक विशेष प्रजाति का औसत वजन 310 पाउंड है या नहीं।

इसका परीक्षण करने के लिए, हम निम्नलिखित वजन वाले कछुओं का एक सरल यादृच्छिक नमूना एकत्र करते हैं:

वजन : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303

निम्नलिखित कोड दिखाता है कि एक-नमूना टी-परीक्षण करने के लिए scipy.stats लाइब्रेरी में ttest_1samp() फ़ंक्शन का उपयोग कैसे करें:

 import scipy.stats as stats

#define data
data = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303]

#perform one sample t-test
stats. ttest_1samp (a=data, popmean= 310 )

Ttest_1sampResult(statistic=-1.5848116313861254, pvalue=0.1389944275158753)

टी-टेस्ट आँकड़ा -1.5848 है और संबंधित दो-पूंछ वाला पी-मान 0.1389 है।

किसी विशेष नमूने पर इस टी-परीक्षण के लिए दो परिकल्पनाएँ इस प्रकार हैं:

  • एच 0 : µ = 310 (कछुए की इस प्रजाति का औसत वजन 310 पाउंड है)
  • एच : µ ≠310 (औसत वजन 310 पाउंड नहीं है)

क्योंकि हमारे परीक्षण का पी-मान (0.1389) अल्फा = 0.05 से अधिक है, हम परीक्षण की शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं।

हमारे पास यह कहने के लिए पर्याप्त सबूत नहीं हैं कि कछुए की इस विशेष प्रजाति का औसत वजन 310 पाउंड के अलावा कुछ और है।

उदाहरण 2: पायथन में दो-नमूना टी-परीक्षण

दो-नमूना टी-परीक्षण का उपयोग यह जांचने के लिए किया जाता है कि दो आबादी के साधन बराबर हैं या नहीं।

उदाहरण के लिए, मान लीजिए हम जानना चाहते हैं कि कछुओं की दो अलग-अलग प्रजातियों का औसत वजन बराबर है या नहीं।

इसका परीक्षण करने के लिए, हम निम्नलिखित वजन के साथ प्रत्येक प्रजाति से कछुओं का एक सरल यादृच्छिक नमूना एकत्र करते हैं:

नमूना 1 : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303

नमूना 2 : 335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305

निम्नलिखित कोड दिखाता है कि इन दो टी-टेस्ट उदाहरणों को निष्पादित करने के लिए scipy.stats लाइब्रेरी में ttest_ind() फ़ंक्शन का उपयोग कैसे करें:

 import scipy. stats as stats

#define array of turtle weights for each sample
sample1 = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303]
sample2 = [335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305]

#perform two sample t-tests
stats. ttest_ind (a=sample1, b=sample2) 

Ttest_indResult(statistic=-2.1009029257555696, pvalue=0.04633501389516516)

टी-टेस्ट आँकड़ा -2.1009 है और संबंधित दो-पूंछ वाला पी-मान 0.0463 है।

इस विशेष दो-नमूना टी-परीक्षण के लिए दो धारणाएँ हैं:

  • एच 0 : µ 1 = µ 2 (दोनों प्रजातियों के बीच औसत वजन बराबर है)
  • एच : µ 1 ≠ µ 2 (दो प्रजातियों के बीच औसत वजन बराबर नहीं है)

चूँकि परीक्षण का पी-मान (0.0463) 0.05 से कम है, हम शून्य परिकल्पना को अस्वीकार करते हैं।

इसका मतलब यह है कि हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि दोनों प्रजातियों के बीच औसत वजन बराबर नहीं है।

उदाहरण 3: पायथॉन में युग्मित नमूने टी-परीक्षण

युग्मित नमूने टी-परीक्षण का उपयोग दो नमूनों के माध्यों की तुलना करने के लिए किया जाता है जब एक नमूने में प्रत्येक अवलोकन को दूसरे नमूने में एक अवलोकन के साथ जोड़ा जा सकता है।

उदाहरण के लिए, मान लें कि हम जानना चाहते हैं कि एक निश्चित प्रशिक्षण कार्यक्रम बास्केटबॉल खिलाड़ियों की अधिकतम ऊर्ध्वाधर छलांग (इंच में) बढ़ाने में सक्षम है या नहीं।

इसका परीक्षण करने के लिए, हम 12 कॉलेज बास्केटबॉल खिलाड़ियों का एक सरल यादृच्छिक नमूना भर्ती कर सकते हैं और उनकी प्रत्येक अधिकतम ऊर्ध्वाधर छलांग को माप सकते हैं। फिर हम प्रत्येक खिलाड़ी को एक महीने के लिए प्रशिक्षण कार्यक्रम का उपयोग करने के लिए कह सकते हैं और फिर महीने के अंत में उनकी अधिकतम ऊर्ध्वाधर छलांग को फिर से माप सकते हैं।

निम्नलिखित डेटा प्रत्येक खिलाड़ी के लिए प्रशिक्षण कार्यक्रम का उपयोग करने से पहले और बाद में अधिकतम छलांग ऊंचाई (इंच में) दिखाता है:

सामने : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21

के बाद : 23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20

निम्नलिखित कोड दिखाता है कि इस युग्मित-नमूने टी-परीक्षण को करने के लिए scipy.stats लाइब्रेरी में ttest_rel() फ़ंक्शन का उपयोग कैसे करें:

 import scipy. stats as stats

#define before and after max jump heights
before = [22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21]
after = [23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20]

#perform paired samples t-test
stats. ttest_rel (a=before, b=after)

Ttest_relResult(statistic=-2.5289026942943655, pvalue=0.02802807458682508)

टी-टेस्ट आँकड़ा -2.5289 है और संबंधित दो-पूंछ वाला पी-मान 0.0280 है।

इस विशेष युग्मित नमूने टी-परीक्षण के लिए दो धारणाएँ हैं:

  • एच 0 : µ 1 = µ 2 (प्रोग्राम का उपयोग करने से पहले और बाद में छलांग की औसत ऊंचाई बराबर है)
  • एच : µ 1 ≠ µ 2 (प्रोग्राम का उपयोग करने से पहले और बाद में छलांग की औसत ऊंचाई बराबर नहीं है)

चूँकि परीक्षण का पी-मान (0.0280) 0.05 से कम है, हम शून्य परिकल्पना को अस्वीकार करते हैं।

इसका मतलब यह है कि हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि प्रशिक्षण कार्यक्रम का उपयोग करने से पहले और बाद में औसत छलांग ऊंचाई बराबर नहीं है।

अतिरिक्त संसाधन

आप विभिन्न टी-परीक्षणों को स्वचालित रूप से निष्पादित करने के लिए निम्नलिखित ऑनलाइन कैलकुलेटर का उपयोग कर सकते हैं:

टी-टेस्ट कैलकुलेटर का एक उदाहरण
दो-नमूना टी-टेस्ट कैलकुलेटर
युग्मित नमूने टी-टेस्ट कैलकुलेटर

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *