पायथन में परिकल्पना परीक्षण कैसे करें (उदाहरण के साथ)
परिकल्पना परीक्षण एक औपचारिक सांख्यिकीय परीक्षण है जिसका उपयोग हम सांख्यिकीय परिकल्पना को अस्वीकार करने या विफल करने के लिए करते हैं।
यह ट्यूटोरियल बताता है कि पायथन में निम्नलिखित परिकल्पना परीक्षण कैसे करें:
- एक नमूना टी परीक्षण
- दो-नमूना टी-परीक्षण
- युग्मित नमूने टी-परीक्षण
चल दर!
उदाहरण 1: पायथन में टी-टेस्ट का एक उदाहरण
एक-नमूना टी-परीक्षण का उपयोग यह जांचने के लिए किया जाता है कि किसी जनसंख्या का माध्य एक निश्चित मूल्य के बराबर है या नहीं।
उदाहरण के लिए, मान लें कि हम जानना चाहते हैं कि कछुए की एक विशेष प्रजाति का औसत वजन 310 पाउंड है या नहीं।
इसका परीक्षण करने के लिए, हम निम्नलिखित वजन वाले कछुओं का एक सरल यादृच्छिक नमूना एकत्र करते हैं:
वजन : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303
निम्नलिखित कोड दिखाता है कि एक-नमूना टी-परीक्षण करने के लिए scipy.stats लाइब्रेरी में ttest_1samp() फ़ंक्शन का उपयोग कैसे करें:
import scipy.stats as stats #define data data = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303] #perform one sample t-test stats. ttest_1samp (a=data, popmean= 310 ) Ttest_1sampResult(statistic=-1.5848116313861254, pvalue=0.1389944275158753)
टी-टेस्ट आँकड़ा -1.5848 है और संबंधित दो-पूंछ वाला पी-मान 0.1389 है।
किसी विशेष नमूने पर इस टी-परीक्षण के लिए दो परिकल्पनाएँ इस प्रकार हैं:
- एच 0 : µ = 310 (कछुए की इस प्रजाति का औसत वजन 310 पाउंड है)
- एच ए : µ ≠310 (औसत वजन 310 पाउंड नहीं है)
क्योंकि हमारे परीक्षण का पी-मान (0.1389) अल्फा = 0.05 से अधिक है, हम परीक्षण की शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं।
हमारे पास यह कहने के लिए पर्याप्त सबूत नहीं हैं कि कछुए की इस विशेष प्रजाति का औसत वजन 310 पाउंड के अलावा कुछ और है।
उदाहरण 2: पायथन में दो-नमूना टी-परीक्षण
दो-नमूना टी-परीक्षण का उपयोग यह जांचने के लिए किया जाता है कि दो आबादी के साधन बराबर हैं या नहीं।
उदाहरण के लिए, मान लीजिए हम जानना चाहते हैं कि कछुओं की दो अलग-अलग प्रजातियों का औसत वजन बराबर है या नहीं।
इसका परीक्षण करने के लिए, हम निम्नलिखित वजन के साथ प्रत्येक प्रजाति से कछुओं का एक सरल यादृच्छिक नमूना एकत्र करते हैं:
नमूना 1 : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303
नमूना 2 : 335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305
निम्नलिखित कोड दिखाता है कि इन दो टी-टेस्ट उदाहरणों को निष्पादित करने के लिए scipy.stats लाइब्रेरी में ttest_ind() फ़ंक्शन का उपयोग कैसे करें:
import scipy. stats as stats #define array of turtle weights for each sample sample1 = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303] sample2 = [335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305] #perform two sample t-tests stats. ttest_ind (a=sample1, b=sample2) Ttest_indResult(statistic=-2.1009029257555696, pvalue=0.04633501389516516)
टी-टेस्ट आँकड़ा -2.1009 है और संबंधित दो-पूंछ वाला पी-मान 0.0463 है।
इस विशेष दो-नमूना टी-परीक्षण के लिए दो धारणाएँ हैं:
- एच 0 : µ 1 = µ 2 (दोनों प्रजातियों के बीच औसत वजन बराबर है)
- एच ए : µ 1 ≠ µ 2 (दो प्रजातियों के बीच औसत वजन बराबर नहीं है)
चूँकि परीक्षण का पी-मान (0.0463) 0.05 से कम है, हम शून्य परिकल्पना को अस्वीकार करते हैं।
इसका मतलब यह है कि हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि दोनों प्रजातियों के बीच औसत वजन बराबर नहीं है।
उदाहरण 3: पायथॉन में युग्मित नमूने टी-परीक्षण
युग्मित नमूने टी-परीक्षण का उपयोग दो नमूनों के माध्यों की तुलना करने के लिए किया जाता है जब एक नमूने में प्रत्येक अवलोकन को दूसरे नमूने में एक अवलोकन के साथ जोड़ा जा सकता है।
उदाहरण के लिए, मान लें कि हम जानना चाहते हैं कि एक निश्चित प्रशिक्षण कार्यक्रम बास्केटबॉल खिलाड़ियों की अधिकतम ऊर्ध्वाधर छलांग (इंच में) बढ़ाने में सक्षम है या नहीं।
इसका परीक्षण करने के लिए, हम 12 कॉलेज बास्केटबॉल खिलाड़ियों का एक सरल यादृच्छिक नमूना भर्ती कर सकते हैं और उनकी प्रत्येक अधिकतम ऊर्ध्वाधर छलांग को माप सकते हैं। फिर हम प्रत्येक खिलाड़ी को एक महीने के लिए प्रशिक्षण कार्यक्रम का उपयोग करने के लिए कह सकते हैं और फिर महीने के अंत में उनकी अधिकतम ऊर्ध्वाधर छलांग को फिर से माप सकते हैं।
निम्नलिखित डेटा प्रत्येक खिलाड़ी के लिए प्रशिक्षण कार्यक्रम का उपयोग करने से पहले और बाद में अधिकतम छलांग ऊंचाई (इंच में) दिखाता है:
सामने : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21
के बाद : 23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20
निम्नलिखित कोड दिखाता है कि इस युग्मित-नमूने टी-परीक्षण को करने के लिए scipy.stats लाइब्रेरी में ttest_rel() फ़ंक्शन का उपयोग कैसे करें:
import scipy. stats as stats #define before and after max jump heights before = [22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21] after = [23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20] #perform paired samples t-test stats. ttest_rel (a=before, b=after) Ttest_relResult(statistic=-2.5289026942943655, pvalue=0.02802807458682508)
टी-टेस्ट आँकड़ा -2.5289 है और संबंधित दो-पूंछ वाला पी-मान 0.0280 है।
इस विशेष युग्मित नमूने टी-परीक्षण के लिए दो धारणाएँ हैं:
- एच 0 : µ 1 = µ 2 (प्रोग्राम का उपयोग करने से पहले और बाद में छलांग की औसत ऊंचाई बराबर है)
- एच ए : µ 1 ≠ µ 2 (प्रोग्राम का उपयोग करने से पहले और बाद में छलांग की औसत ऊंचाई बराबर नहीं है)
चूँकि परीक्षण का पी-मान (0.0280) 0.05 से कम है, हम शून्य परिकल्पना को अस्वीकार करते हैं।
इसका मतलब यह है कि हमारे पास यह कहने के लिए पर्याप्त सबूत हैं कि प्रशिक्षण कार्यक्रम का उपयोग करने से पहले और बाद में औसत छलांग ऊंचाई बराबर नहीं है।
अतिरिक्त संसाधन
आप विभिन्न टी-परीक्षणों को स्वचालित रूप से निष्पादित करने के लिए निम्नलिखित ऑनलाइन कैलकुलेटर का उपयोग कर सकते हैं:
टी-टेस्ट कैलकुलेटर का एक उदाहरण
दो-नमूना टी-टेस्ट कैलकुलेटर
युग्मित नमूने टी-टेस्ट कैलकुलेटर