पायथन में आत्मविश्वास अंतराल की गणना कैसे करें


किसी माध्य के लिए आत्मविश्वास अंतराल मूल्यों की एक श्रृंखला है जिसमें एक निश्चित स्तर के आत्मविश्वास के साथ जनसंख्या माध्य शामिल होने की संभावना होती है।

इसकी गणना इस प्रकार की जाती है:

आत्मविश्वास अंतराल = x +/- t*(s/√n)

सोना:

  • x : नमूना का अर्थ है
  • टी: टी मान जो आत्मविश्वास के स्तर से मेल खाता है
  • एस: नमूना मानक विचलन
  • n: नमूना आकार

यह ट्यूटोरियल बताता है कि पायथन में आत्मविश्वास अंतराल की गणना कैसे करें।

टी वितरण का उपयोग करते हुए आत्मविश्वास अंतराल

यदि हम एक छोटे नमूने (n <30) के साथ काम कर रहे हैं, तो हम जनसंख्या माध्य के लिए विश्वास अंतराल की गणना करने के लिए scipy.stats लाइब्रेरी से t.interval() फ़ंक्शन का उपयोग कर सकते हैं।

निम्नलिखित उदाहरण दिखाता है कि 15 पौधों के नमूने का उपयोग करके, एक निश्चित पौधे की प्रजाति की वास्तविक औसत जनसंख्या ऊंचाई (इंच में) के लिए आत्मविश्वास अंतराल की गणना कैसे की जाए:

 import numpy as np
import scipy.stats as st

#define sample data
data = [12, 12, 13, 13, 15, 16, 17, 22, 23, 25, 26, 27, 28, 28, 29]

#create 95% confidence interval for population mean weight
st.t.interval(alpha=0.95, df=len(data)-1, loc=np.mean(data), scale=st.sem(data)) 

(16.758, 24.042)

वास्तविक औसत जनसंख्या आकार के लिए 95% विश्वास अंतराल (16.758, 24.042) है।

आप देखेंगे कि आत्मविश्वास का स्तर जितना अधिक होगा, आत्मविश्वास का अंतराल उतना ही व्यापक होगा। उदाहरण के लिए, यहां ठीक उसी डेटा के लिए 99% सीआई की गणना करने का तरीका बताया गया है:

 #create 99% confidence interval for same sample
st.t.interval(alpha= 0.99 , df=len(data)-1, loc=np.mean(data), scale=st.sem(data)) 

(15.348, 25.455)

वास्तविक औसत जनसंख्या आकार के लिए 99% विश्वास अंतराल (15.348, 25.455) है। ध्यान दें कि यह अंतराल पिछले 95% विश्वास अंतराल से अधिक व्यापक है।

सामान्य वितरण का उपयोग करते हुए विश्वास अंतराल

यदि हम बड़े नमूनों (n≥30) के साथ काम कर रहे हैं, तो हम मान सकते हैं कि नमूना माध्य का नमूना वितरण सामान्य रूप से वितरित किया जाता है ( केंद्रीय सीमा प्रमेय के लिए धन्यवाद) और इसके बजाय मानक फ़ंक्शन का उपयोग कर सकते हैं। scipy .stats लाइब्रेरी से अंतराल()

निम्नलिखित उदाहरण दिखाता है कि 50 पौधों के नमूने का उपयोग करके, एक निश्चित पौधे की प्रजाति की वास्तविक औसत जनसंख्या ऊंचाई (इंच में) के लिए आत्मविश्वास अंतराल की गणना कैसे की जाए:

 import numpy as np
import scipy.stats as st

#define sample data
np.random.seed(0)
data = np.random.randint(10, 30, 50)

#create 95% confidence interval for population mean weight
st.norm.interval(alpha=0.95, loc=np.mean(data), scale=st.sem(data))

(17.40, 21.08)

वास्तविक औसत जनसंख्या आकार के लिए 95% विश्वास अंतराल (17.40, 21.08) है।

और टी वितरण के साथ, उच्च आत्मविश्वास का स्तर व्यापक आत्मविश्वास अंतराल को जन्म देता है। उदाहरण के लिए, यहां ठीक उसी डेटा के लिए 99% सीआई की गणना करने का तरीका बताया गया है:

 #create 99% confidence interval for same sample
st.norm.interval(alpha= 0.99 , loc=np.mean(data), scale=st.sem(data))

(16.82, 21.66)

वास्तविक औसत जनसंख्या आकार के लिए 95% विश्वास अंतराल (17.82, 21.66) है।

आत्मविश्वास अंतराल की व्याख्या कैसे करें

मान लें कि किसी पौधे की प्रजाति की वास्तविक औसत ऊंचाई के लिए हमारा 95% विश्वास अंतराल है:

95% विश्वास अंतराल = (16.758, 24.042)

इस विश्वास अंतराल की व्याख्या करने का तरीका इस प्रकार है:

95% संभावना है कि [16.758, 24.042] के आत्मविश्वास अंतराल में जनसंख्या की वास्तविक औसत पौधे की ऊंचाई शामिल है।

इसी बात को कहने का दूसरा तरीका यह है कि केवल 5% संभावना है कि वास्तविक जनसंख्या माध्य 95% विश्वास अंतराल के बाहर है। यानी केवल 5% संभावना है कि पौधे की वास्तविक औसत ऊंचाई 16.758 इंच से कम या 24.042 इंच से अधिक होगी।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *