केंद्रीय सीमा प्रमेय: परिभाषा + उदाहरण
केंद्रीय सीमा प्रमेय में कहा गया है कि यदि नमूना आकार काफी बड़ा है, तो नमूना माध्य का नमूना वितरण लगभग सामान्य है, भले ही जनसंख्या वितरण सामान्य न हो ।
केंद्रीय सीमा प्रमेय यह भी बताता है कि नमूना वितरण में निम्नलिखित गुण होंगे:
1. नमूना वितरण का माध्य जनसंख्या वितरण के माध्य के बराबर होगा:
एक्स = µ
2. नमूना वितरण का विचरण नमूना आकार से विभाजित जनसंख्या वितरण के विचरण के बराबर होगा:
s2 = σ2 /n
केंद्रीय सीमा प्रमेय के उदाहरण
व्यवहार में केंद्रीय सीमा प्रमेय को स्पष्ट करने के लिए यहां कुछ उदाहरण दिए गए हैं।
वर्दी वितरण
मान लीजिए कि कछुए के खोल की चौड़ाई एक समान वितरण का पालन करती है जिसमें न्यूनतम चौड़ाई 2 इंच और अधिकतम चौड़ाई 6 इंच होती है। यानी, अगर हम यादृच्छिक रूप से एक कछुए का चयन करते हैं और उसके खोल की चौड़ाई मापते हैं, तो इसकी चौड़ाई भी 2 से 6 इंच के बीच होने की संभावना है।
यदि हम कछुए के खोल की चौड़ाई के वितरण को दर्शाने के लिए एक हिस्टोग्राम बनाते हैं, तो यह इस तरह दिखेगा:
एक समान वितरण का माध्य μ = (b+a) / 2 है जहां b सबसे बड़ा संभव मान है और a सबसे छोटा संभव मान है। इस स्थिति में यह (6+2)/2 = 4 है।
एक समान वितरण का प्रसरण σ2 = (ba) 2/12 है। इस स्थिति में यह (6-2) 2/12 = 1.33 है
समान वितरण से 2 के यादृच्छिक नमूने लेना
अब कल्पना करें कि हम इस आबादी से 2 कछुओं का एक यादृच्छिक नमूना लेते हैं और प्रत्येक कछुए के खोल की चौड़ाई मापते हैं। मान लेते हैं कि पहले कछुए का खोल 3 इंच चौड़ा है और दूसरे का 6 इंच चौड़ा है। 2 कछुओं के इस नमूने की औसत चौड़ाई 4.5 इंच है।
इसके बाद, कल्पना करें कि हम इस आबादी से 2 कछुओं का एक और यादृच्छिक नमूना लेते हैं और प्रत्येक कछुए की खोल की चौड़ाई फिर से मापते हैं। मान लेते हैं कि पहले कछुए का खोल 2.5 इंच चौड़ा है और दूसरे का भी 2.5 इंच चौड़ा है। 2 कछुओं के इस नमूने की औसत चौड़ाई 2.5 इंच है।
कल्पना कीजिए कि हम बार-बार 2 कछुओं से यादृच्छिक नमूने लेते रहते हैं और हर बार औसत खोल की चौड़ाई ज्ञात करते रहते हैं।
यदि हमने 2 कछुओं के इन सभी नमूनों की औसत शैल चौड़ाई का प्रतिनिधित्व करने के लिए एक हिस्टोग्राम बनाया, तो यह इस तरह दिखेगा:
इसे नमूना साधनों के लिए नमूना वितरण कहा जाता है क्योंकि यह नमूना साधनों के वितरण को दर्शाता है।
इस नमूना वितरण का माध्य x = μ = 4 है
इस नमूना वितरण का विचरण s2 = σ2 / n = 1.33 / 2 = 0.665 है
समान वितरण से 5 के यादृच्छिक नमूने लेना
अब कल्पना कीजिए कि हम वही प्रयोग दोहराते हैं, लेकिन इस बार हम 5 कछुओं से बार-बार यादृच्छिक नमूने लेते हैं और हर बार औसत खोल की चौड़ाई ज्ञात करते हैं।
यदि हम 5 कछुओं के इन सभी नमूनों की औसत शैल चौड़ाई का प्रतिनिधित्व करने के लिए एक हिस्टोग्राम बनाते हैं, तो यह इस तरह दिखेगा:
ध्यान दें कि इस वितरण में “घंटी” का आकार अधिक है जो सामान्य वितरण जैसा दिखता है। ऐसा इसलिए है क्योंकि जब हम 5 के नमूने लेते हैं, तो हमारे नमूना साधनों के बीच का अंतर बहुत कम होता है, इसलिए हमें 2 इंच या 6 इंच के करीब औसत वाले नमूने मिलने की संभावना कम होती है और 2 इंच या 6 इंच के करीब औसत वाले नमूने प्राप्त होने की अधिक संभावना होती है। 6 इंच। औसत वास्तविक जनसंख्या औसत के 4 इंच करीब है।
इस नमूना वितरण का माध्य x = μ = 4 है
इस नमूना वितरण का विचरण s2 = σ2 / n = 1.33 / 5 = 0.266 है
वर्दी वितरण से 30 के यादृच्छिक नमूने लेना
अब कल्पना करें कि हम वही प्रयोग दोहराते हैं, लेकिन इस बार हम 30 कछुओं से बार-बार यादृच्छिक नमूने लेते हैं और हर बार औसत खोल की चौड़ाई पाते हैं।
यदि हम 30 कछुओं के इन सभी नमूनों की औसत शैल चौड़ाई का प्रतिनिधित्व करने के लिए एक हिस्टोग्राम बनाते हैं, तो यह इस तरह दिखेगा:
ध्यान दें कि यह नमूना वितरण पिछले दो वितरणों की तुलना में और भी अधिक घंटी के आकार का और बहुत संकीर्ण है।
इस नमूना वितरण का माध्य x = μ = 4 है
इस नमूना वितरण का विचरण s2 = σ2 / n = 1.33 / 30 = 0.044 है
ची-स्क्वायर वितरण
मान लीजिए कि एक निश्चित शहर में प्रति परिवार पालतू जानवरों की संख्या तीन डिग्री स्वतंत्रता के साथ काई-स्क्वायर वितरण का अनुसरण करती है। यदि हम परिवार द्वारा जानवरों के वितरण को दर्शाने के लिए एक हिस्टोग्राम बनाएं, तो यह इस तरह दिखेगा:
ची-स्क्वायर वितरण का माध्य केवल स्वतंत्रता की डिग्री (डीएफ) की संख्या है। इस स्थिति में, μ = 3 ।
ची-स्क्वायर वितरण का विचरण 2*df है। इस स्थिति में, σ2 = 2 * 3 = 6 ।
2 के यादृच्छिक नमूने लेना
कल्पना कीजिए कि हम इस आबादी से 2 परिवारों का एक यादृच्छिक नमूना लेते हैं और प्रत्येक परिवार में पालतू जानवरों की संख्या की गणना करते हैं। मान लीजिए कि पहले परिवार में 4 पालतू जानवर हैं और दूसरे परिवार में 1 पालतू जानवर है। 2 परिवारों के इस नमूने में पालतू जानवरों की औसत संख्या 2.5 है।
फिर कल्पना करें कि हम इस आबादी से 2 परिवारों का एक और यादृच्छिक नमूना लेते हैं और प्रत्येक परिवार में पालतू जानवरों की संख्या फिर से गिनते हैं। मान लीजिए कि पहले परिवार में 6 पालतू जानवर हैं और दूसरे परिवार में 4 पालतू जानवर हैं। 2 परिवारों के इस नमूने में पालतू जानवरों की औसत संख्या 5 है।
कल्पना कीजिए कि हम दो परिवारों से बार-बार यादृच्छिक नमूने लेते रहते हैं और हर बार पालतू जानवरों की औसत संख्या का पता लगाते रहते हैं।
यदि हम 2 परिवारों के इन सभी नमूनों में पालतू जानवरों की औसत संख्या दर्शाने के लिए एक हिस्टोग्राम बनाएं, तो यह इस तरह दिखेगा:
इस नमूना वितरण का माध्य x = μ = 3 है
इस नमूना वितरण का विचरण s 2 = σ 2 / n = 6 / 2 = 3 है
10 के रैंडम सैंपल लिए जा रहे हैं
अब कल्पना करें कि हम वही प्रयोग दोहराते हैं, लेकिन इस बार हम 10 परिवारों के यादृच्छिक नमूने बार-बार लेते हैं और हर बार प्रति परिवार जानवरों की औसत संख्या ज्ञात करते हैं।
यदि हम 10 परिवारों के इन सभी नमूनों में प्रति परिवार जानवरों की औसत संख्या दर्शाने के लिए एक हिस्टोग्राम बनाएं, तो यह इस तरह दिखेगा:
इस नमूना वितरण का माध्य x = μ = 3 है
इस नमूना वितरण का विचरण s2 = σ2 / n = 6/10 = 0.6 है
30 के रैंडम सैंपल लिए जा रहे हैं
अब कल्पना कीजिए कि हम वही प्रयोग दोहराते हैं, लेकिन इस बार हम बार-बार 30 परिवारों के यादृच्छिक नमूने लेते हैं और हर बार प्रति परिवार जानवरों की औसत संख्या निकालते हैं।
यदि हम 30 परिवारों के इन सभी नमूनों में प्रति परिवार जानवरों की औसत संख्या दर्शाने के लिए एक हिस्टोग्राम बनाएं, तो यह इस तरह दिखेगा:
इस नमूना वितरण का माध्य x = μ = 3 है
इस नमूना वितरण का विचरण s2 = σ2 / n = 6/30 = 0.2 है
सारांश
इन दो उदाहरणों से मुख्य निष्कर्ष यहां दिए गए हैं:
- यदि नमूना आकार काफी बड़ा है, तो नमूना माध्य का नमूना वितरण लगभग सामान्य है, भले ही जनसंख्या वितरण सामान्य न हो । उपरोक्त दो उदाहरणों में, न तो समान वितरण और न ही ची-स्क्वायर वितरण सामान्य थे (वे बिल्कुल भी “घंटी” के आकार के नहीं थे), लेकिन जब हमने एक बड़ा पर्याप्त नमूना लिया, तो नमूना माध्य का वितरण बदल गया है जैसा प्रतीत होता है सामान्य हो।
- नमूना आकार जितना बड़ा होगा, नमूना माध्य का विचरण उतना ही कम होगा।
“काफी बड़ा” परिभाषित करें
याद रखें कि केंद्रीय सीमा प्रमेय में कहा गया है कि यदि नमूना आकार “काफी बड़ा” है, तो नमूने का नमूना वितरण लगभग सामान्य है, भले ही जनसंख्या वितरण सामान्य न हो।
केंद्रीय सीमा प्रमेय को लागू करने के लिए एक नमूना कितना बड़ा होना चाहिए इसकी कोई सटीक परिभाषा नहीं है, लेकिन सामान्य तौर पर यह जनसंख्या वितरण की विषमता पर निर्भर करता है जिससे नमूना आता है:
- यदि जनसंख्या वितरण सममित है, तो 15 जितना छोटा नमूना आकार कभी-कभी पर्याप्त होता है।
- यदि जनसंख्या वितरण विषम है, तो आमतौर पर कम से कम 30 लोगों का एक नमूना आवश्यक है।
- यदि जनसंख्या वितरण अत्यधिक विषम है, तो 40 या अधिक लोगों का नमूना आवश्यक हो सकता है।
इस विषय पर अधिक जानकारी के लिए एक बड़े नमूने की कंडीशनिंग पर यह ट्यूटोरियल देखें।