पायथन में आत्मविश्वास अंतराल की गणना कैसे करें
किसी माध्य के लिए आत्मविश्वास अंतराल मूल्यों की एक श्रृंखला है जिसमें एक निश्चित स्तर के आत्मविश्वास के साथ जनसंख्या माध्य शामिल होने की संभावना होती है।
इसकी गणना इस प्रकार की जाती है:
आत्मविश्वास अंतराल = x +/- t*(s/√n)
सोना:
- x : नमूना का अर्थ है
- टी: टी मान जो आत्मविश्वास के स्तर से मेल खाता है
- एस: नमूना मानक विचलन
- n: नमूना आकार
यह ट्यूटोरियल बताता है कि पायथन में आत्मविश्वास अंतराल की गणना कैसे करें।
टी वितरण का उपयोग करते हुए आत्मविश्वास अंतराल
यदि हम एक छोटे नमूने (n <30) के साथ काम कर रहे हैं, तो हम जनसंख्या माध्य के लिए विश्वास अंतराल की गणना करने के लिए scipy.stats लाइब्रेरी से t.interval() फ़ंक्शन का उपयोग कर सकते हैं।
निम्नलिखित उदाहरण दिखाता है कि 15 पौधों के नमूने का उपयोग करके, एक निश्चित पौधे की प्रजाति की वास्तविक औसत जनसंख्या ऊंचाई (इंच में) के लिए आत्मविश्वास अंतराल की गणना कैसे की जाए:
import numpy as np import scipy.stats as st #define sample data data = [12, 12, 13, 13, 15, 16, 17, 22, 23, 25, 26, 27, 28, 28, 29] #create 95% confidence interval for population mean weight st.t.interval(alpha=0.95, df=len(data)-1, loc=np.mean(data), scale=st.sem(data)) (16.758, 24.042)
वास्तविक औसत जनसंख्या आकार के लिए 95% विश्वास अंतराल (16.758, 24.042) है।
आप देखेंगे कि आत्मविश्वास का स्तर जितना अधिक होगा, आत्मविश्वास का अंतराल उतना ही व्यापक होगा। उदाहरण के लिए, यहां ठीक उसी डेटा के लिए 99% सीआई की गणना करने का तरीका बताया गया है:
#create 99% confidence interval for same sample st.t.interval(alpha= 0.99 , df=len(data)-1, loc=np.mean(data), scale=st.sem(data)) (15.348, 25.455)
वास्तविक औसत जनसंख्या आकार के लिए 99% विश्वास अंतराल (15.348, 25.455) है। ध्यान दें कि यह अंतराल पिछले 95% विश्वास अंतराल से अधिक व्यापक है।
सामान्य वितरण का उपयोग करते हुए विश्वास अंतराल
यदि हम बड़े नमूनों (n≥30) के साथ काम कर रहे हैं, तो हम मान सकते हैं कि नमूना माध्य का नमूना वितरण सामान्य रूप से वितरित किया जाता है ( केंद्रीय सीमा प्रमेय के लिए धन्यवाद) और इसके बजाय मानक फ़ंक्शन का उपयोग कर सकते हैं। scipy .stats लाइब्रेरी से अंतराल() ।
निम्नलिखित उदाहरण दिखाता है कि 50 पौधों के नमूने का उपयोग करके, एक निश्चित पौधे की प्रजाति की वास्तविक औसत जनसंख्या ऊंचाई (इंच में) के लिए आत्मविश्वास अंतराल की गणना कैसे की जाए:
import numpy as np import scipy.stats as st #define sample data np.random.seed(0) data = np.random.randint(10, 30, 50) #create 95% confidence interval for population mean weight st.norm.interval(alpha=0.95, loc=np.mean(data), scale=st.sem(data)) (17.40, 21.08)
वास्तविक औसत जनसंख्या आकार के लिए 95% विश्वास अंतराल (17.40, 21.08) है।
और टी वितरण के साथ, उच्च आत्मविश्वास का स्तर व्यापक आत्मविश्वास अंतराल को जन्म देता है। उदाहरण के लिए, यहां ठीक उसी डेटा के लिए 99% सीआई की गणना करने का तरीका बताया गया है:
#create 99% confidence interval for same sample st.norm.interval(alpha= 0.99 , loc=np.mean(data), scale=st.sem(data)) (16.82, 21.66)
वास्तविक औसत जनसंख्या आकार के लिए 95% विश्वास अंतराल (17.82, 21.66) है।
आत्मविश्वास अंतराल की व्याख्या कैसे करें
मान लें कि किसी पौधे की प्रजाति की वास्तविक औसत ऊंचाई के लिए हमारा 95% विश्वास अंतराल है:
95% विश्वास अंतराल = (16.758, 24.042)
इस विश्वास अंतराल की व्याख्या करने का तरीका इस प्रकार है:
95% संभावना है कि [16.758, 24.042] के आत्मविश्वास अंतराल में जनसंख्या की वास्तविक औसत पौधे की ऊंचाई शामिल है।
इसी बात को कहने का दूसरा तरीका यह है कि केवल 5% संभावना है कि वास्तविक जनसंख्या माध्य 95% विश्वास अंतराल के बाहर है। यानी केवल 5% संभावना है कि पौधे की वास्तविक औसत ऊंचाई 16.758 इंच से कम या 24.042 इंच से अधिक होगी।