सांख्यिकीय बनाम व्यावहारिक महत्व की एक सरल व्याख्या


एक सांख्यिकीय परिकल्पना जनसंख्या पैरामीटर के बारे में एक धारणा है। उदाहरण के लिए, हम मान सकते हैं कि एक निश्चित काउंटी में एक आदमी की औसत ऊंचाई 68 इंच है। ऊंचाई के संबंध में परिकल्पना सांख्यिकीय परिकल्पना है और संयुक्त राज्य अमेरिका में एक आदमी की वास्तविक औसत ऊंचाई जनसंख्या पैरामीटर है।

परिकल्पना परीक्षण एक औपचारिक सांख्यिकीय परीक्षण है जिसका उपयोग हम सांख्यिकीय परिकल्पना को अस्वीकार करने या विफल करने के लिए करते हैं। परिकल्पना परीक्षण करने के लिए, हम जनसंख्या से एक यादृच्छिक नमूना प्राप्त करते हैं और यह निर्धारित करते हैं कि क्या नमूने में डेटा घटित होने की संभावना है, यह देखते हुए कि शून्य परिकल्पना वास्तव में सत्य है।

यदि इस परिकल्पना के तहत नमूना डेटा पर्याप्त रूप से असंभव है, तो हम शून्य परिकल्पना को अस्वीकार कर सकते हैं और निष्कर्ष निकाल सकते हैं कि एक प्रभाव मौजूद है।

जिस तरह से हम यह निर्धारित करते हैं कि नमूना डेटा “पर्याप्त रूप से असंभव” है या नहीं, यह मानते हुए कि शून्य सत्य है, एक निश्चित महत्व स्तर निर्धारित करना है (आमतौर पर 0.01, 0.05, या 0.10 चुना जाता है), फिर जांचें कि परिकल्पना परीक्षण का पी-मूल्य कम है या नहीं महत्व के इस स्तर से.

यदि पी-मान महत्व स्तर से कम है, तो हम कहते हैं कि परिणाम सांख्यिकीय रूप से महत्वपूर्ण हैं। इसका मतलब सिर्फ यह है कि एक निश्चित प्रभाव मौजूद है, लेकिन इसका मतलब यह नहीं है कि यह प्रभाव वास्तविक दुनिया में वास्तव में व्यावहारिक है। परिणाम व्यावहारिक रूप से महत्वपूर्ण हुए बिना भी सांख्यिकीय रूप से महत्वपूर्ण हो सकते हैं।

संबंधित: पी मूल्यों और सांख्यिकीय महत्व की व्याख्या

व्यावहारिक महत्व

प्रभाव के छोटे आकार के बावजूद, परिकल्पना परीक्षण के लिए सांख्यिकीय रूप से महत्वपूर्ण परिणाम उत्पन्न करना संभव है। ऐसे दो मुख्य तरीके हैं जिनसे छोटे प्रभाव आकार कम (और इसलिए सांख्यिकीय रूप से महत्वपूर्ण) पी-मान उत्पन्न कर सकते हैं:

1. नमूना किए गए डेटा की परिवर्तनशीलता बहुत कम है। जब आपके नमूना डेटा में कम परिवर्तनशीलता होती है, तो एक परिकल्पना परीक्षण जनसंख्या प्रभाव का अधिक सटीक अनुमान लगाने में सक्षम होता है, जिससे परीक्षण छोटे प्रभावों का भी पता लगा सकता है।

उदाहरण के लिए, मान लीजिए कि हम निम्नलिखित दो नमूनों पर एक स्वतंत्र दो-नमूना टी-परीक्षण करना चाहते हैं जो दो अलग-अलग स्कूलों के 20 छात्रों के परीक्षण स्कोर दिखाते हैं ताकि यह निर्धारित किया जा सके कि स्कूलों के बीच औसत परीक्षण स्कोर काफी भिन्न हैं या नहीं:

 sample 1: 85 85 86 86 85 86 86 86 86 85 85 85 86 85 86 85 86 86 85 86
sample 2: 87 86 87 86 86 86 86 86 87 86 86 87 86 86 87 87 87 86 87 86

नमूना 1 का माध्य 85.55 है और नमूना 2 का माध्य 86.40 है। जब हम एक स्वतंत्र दो-नमूना टी-परीक्षण करते हैं, तो यह पता चलता है कि परीक्षण आँकड़ा -5.3065 है और संबंधित पी-मान <0.0001 है। परीक्षण परिणामों के बीच अंतर सांख्यिकीय रूप से महत्वपूर्ण है।

इन दोनों नमूनों के औसत परीक्षण स्कोर के बीच का अंतर केवल 0.85 है, लेकिन प्रत्येक स्कूल के लिए परीक्षण स्कोर में कम परिवर्तनशीलता के परिणामस्वरूप सांख्यिकीय रूप से महत्वपूर्ण परिणाम मिलता है। ध्यान दें कि स्कोर का मानक विचलन नमूना 1 के लिए 0.51 और नमूना 2 के लिए 0.50 है।

इस कम परिवर्तनशीलता ने परिकल्पना परीक्षण को स्कोर के बीच छोटे अंतर का पता लगाने और अंतर को सांख्यिकीय रूप से महत्वपूर्ण होने की अनुमति दी।

कम परिवर्तनशीलता के कारण सांख्यिकीय रूप से महत्वपूर्ण निष्कर्ष क्यों निकल सकते हैं इसका अंतर्निहित कारण यह है कि एक स्वतंत्र दो-नमूना टी-परीक्षण के लिए टी- परीक्षण आँकड़े की गणना निम्नानुसार की जाती है:

परीक्षण आँकड़ा t = [( x 1x 2 ) – d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )

जहां s 2 1 और s 2 2 क्रमशः नमूना 1 और नमूना 2 के लिए नमूना भिन्नता दर्शाते हैं। ध्यान दें कि जब ये दो संख्याएँ छोटी होती हैं, तो t- परीक्षण आँकड़े का पूर्णांक हर छोटा होता है।

और जब आप एक छोटी संख्या से भाग देते हैं, तो आपको एक बड़ी संख्या प्राप्त होती है। इसका मतलब यह है कि टी- परीक्षण आँकड़ा बड़ा होगा और संबंधित पी-मूल्य छोटा होगा, इस प्रकार सांख्यिकीय रूप से महत्वपूर्ण परिणाम प्राप्त होंगे।

2. नमूने का आकार बहुत बड़ा है. नमूना आकार जितना बड़ा होगा, परिकल्पना परीक्षण की सांख्यिकीय शक्ति उतनी ही अधिक होगी, जिससे वह छोटे प्रभावों का भी पता लगा सकेगा। इससे सांख्यिकीय रूप से महत्वपूर्ण परिणाम मिल सकते हैं, छोटे प्रभावों के बावजूद जिनका कोई व्यावहारिक महत्व नहीं हो सकता है।

उदाहरण के लिए, मान लीजिए कि हम निम्नलिखित दो नमूनों पर एक स्वतंत्र दो-नमूना टी-परीक्षण करना चाहते हैं जो दो अलग-अलग स्कूलों के 20 छात्रों के परीक्षण स्कोर दिखाते हैं ताकि यह निर्धारित किया जा सके कि स्कूलों के बीच औसत परीक्षण स्कोर काफी भिन्न हैं या नहीं:

 Sample 1: 88 89 91 94 87 94 94 92 91 86 87 87 92 89 93 90 92 95 89 93
Sample 2: 95 88 93 87 89 90 86 90 95 89 91 92 91 88 94 93 94 87 93 90

यदि हम अंकों के वितरण को प्रदर्शित करने के लिए प्रत्येक नमूने के लिए एक बॉक्सप्लॉट बनाते हैं, तो हम देख सकते हैं कि वे बहुत समान दिखते हैं:

नमूना 1 का माध्य 90.65 है और नमूना 2 का माध्य 90.75 है। नमूना 1 के लिए मानक विचलन 2.77 है और नमूना 2 के लिए मानक विचलन 2.78 है। जब हम एक स्वतंत्र दो-नमूना टी-परीक्षण करते हैं, तो यह पता चलता है कि परीक्षण आँकड़ा -0.113 है और संबंधित पी-मान 0.91 है। औसत परीक्षण स्कोर के बीच का अंतर सांख्यिकीय रूप से महत्वपूर्ण नहीं है।

हालाँकि, विचार करें कि क्या दोनों नमूनों का नमूना आकार 200 था। इस मामले में, एक स्वतंत्र दो-नमूना टी-परीक्षण से पता चलेगा कि परीक्षण आँकड़ा -1.97 है और संबंधित पी-मान 0.05 से ठीक नीचे है। औसत परीक्षण स्कोर के बीच का अंतर सांख्यिकीय रूप से महत्वपूर्ण है।

बड़े नमूना आकारों के कारण सांख्यिकीय रूप से महत्वपूर्ण निष्कर्ष क्यों निकल सकते हैं इसका अंतर्निहित कारण एक बार फिर एक स्वतंत्र दो-नमूना टी-परीक्षण के लिए टी- परीक्षण आंकड़ों पर वापस जाता है:

परीक्षण आँकड़ा t = [( x 1x 2 ) – d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )

ध्यान दें कि जब n 1 और n 2 छोटे होते हैं, तो t- परीक्षण आँकड़े का पूर्णांक हर छोटा होता है। और जब आप एक छोटी संख्या से भाग देते हैं, तो आपको एक बड़ी संख्या प्राप्त होती है। इसका मतलब यह है कि टी- परीक्षण आँकड़ा बड़ा होगा और संबंधित पी-मूल्य छोटा होगा, इस प्रकार सांख्यिकीय रूप से महत्वपूर्ण परिणाम प्राप्त होंगे।

व्यावहारिक महत्व का आकलन करने के लिए विषय वस्तु विशेषज्ञता का उपयोग करें

यह निर्धारित करने के लिए कि क्या परिकल्पना परीक्षण से सांख्यिकीय रूप से महत्वपूर्ण परिणाम व्यावहारिक रूप से सार्थक है, विषय वस्तु विशेषज्ञता अक्सर आवश्यक होती है।

पिछले उदाहरणों में, जब हम दो स्कूलों के टेस्ट स्कोर के बीच अंतर के लिए परीक्षण कर रहे थे, तो स्कूलों में काम करने वाले या इस प्रकार के परीक्षणों का प्रबंधन करने वाले किसी व्यक्ति की विशेषज्ञता प्राप्त करना सहायक होगा ताकि हमें यह निर्धारित करने में मदद मिल सके कि औसत अंतर 1 है या नहीं। बिंदु मौजूद है या नहीं. व्यावहारिक निहितार्थ हैं।

उदाहरण के लिए, 1 अंक का औसत अंतर अल्फ़ा = 0.05 स्तर पर सांख्यिकीय रूप से महत्वपूर्ण हो सकता है, लेकिन क्या इसका मतलब यह है कि सबसे कम स्कोर वाले स्कूल को वह कार्यक्रम अपनाना चाहिए जो उच्चतम स्कोर वाला स्कूल अधिक उपयोग करता है? या क्या इसमें बहुत अधिक प्रशासनिक लागत शामिल होगी और इसे लागू करना बहुत महंगा/बहुत जल्दी होगा?

सिर्फ इसलिए कि दो स्कूलों के बीच टेस्ट स्कोर में सांख्यिकीय रूप से महत्वपूर्ण अंतर है, इसका मतलब यह नहीं है कि अंतर का प्रभाव आकार इतना बड़ा है कि शिक्षा प्रणाली में किसी प्रकार का बदलाव हो सकता है।

व्यावहारिक महत्व का आकलन करने के लिए आत्मविश्वास अंतराल का उपयोग करना

व्यावहारिक महत्व निर्धारित करने के लिए एक अन्य उपयोगी उपकरण आत्मविश्वास अंतराल है। एक आत्मविश्वास अंतराल हमें मूल्यों की एक श्रृंखला देता है जिसके भीतर वास्तविक जनसंख्या पैरामीटर झूठ बोलने की संभावना है।

उदाहरण के लिए, आइए दो स्कूलों के बीच परीक्षण अंकों में अंतर की तुलना करने के उदाहरण पर वापस लौटें। एक प्रिंसिपल यह घोषणा कर सकता है कि स्कूल के लिए एक नया कार्यक्रम अपनाने के लिए कम से कम 5 अंकों का औसत स्कोर अंतर आवश्यक है।

एक अध्ययन में, हम देख सकते हैं कि परीक्षण स्कोर के बीच औसत अंतर 8 अंक है। हालाँकि, इस माध्य के आसपास विश्वास अंतराल [4, 12] हो सकता है, जो दर्शाता है कि 4 औसत परीक्षण परिणामों के बीच वास्तविक अंतर हो सकता है। इस मामले में, प्रिंसिपल यह निष्कर्ष निकाल सकता है कि स्कूल कार्यक्रम में बदलाव नहीं करेगा क्योंकि आत्मविश्वास अंतराल इंगित करता है कि वास्तविक अंतर 5 से कम हो सकता है।

हालाँकि, एक अन्य अध्ययन में हम देख सकते हैं कि परीक्षण परिणामों के बीच औसत अंतर फिर से 8 अंक है, लेकिन औसत के आसपास विश्वास अंतराल [6,10] हो सकता है। चूँकि इस अंतराल में 5 शामिल नहीं है, निदेशक संभवतः यह निष्कर्ष निकालेगा कि परीक्षण स्कोर के बीच वास्तविक अंतर 5 से अधिक है और इस प्रकार यह निर्धारित करेगा कि कार्यक्रम को संशोधित करना उचित है।

निष्कर्ष

अंत में, हमने यही सीखा:

  • सांख्यिकीय महत्व केवल यह दर्शाता है कि महत्व के एक निश्चित स्तर के आधार पर कोई प्रभाव है या नहीं।
  • व्यावहारिक महत्व यह है कि इस प्रभाव का वास्तविक दुनिया में व्यावहारिक प्रभाव है या नहीं।
  • हम व्यावहारिक महत्व का आकलन करने के लिए सांख्यिकीय महत्व और डोमेन विशेषज्ञता निर्धारित करने के लिए सांख्यिकीय विश्लेषण का उपयोग करते हैं।
  • छोटे प्रभाव आकार छोटे पी-मान उत्पन्न कर सकते हैं जब (1) नमूना डेटा की परिवर्तनशीलता बहुत छोटी होती है और जब (2) नमूना आकार बहुत बड़ा होता है।
  • परिकल्पना परीक्षण आयोजित करने से पहले न्यूनतम प्रभाव आकार निर्धारित करके, हम बेहतर आकलन कर सकते हैं कि परिकल्पना परीक्षण का परिणाम (भले ही यह सांख्यिकीय रूप से महत्वपूर्ण हो) वास्तविक दुनिया में वास्तव में व्यावहारिक है या नहीं।
  • व्यावहारिक महत्व निर्धारित करने में आत्मविश्वास अंतराल उपयोगी हो सकता है। यदि न्यूनतम प्रभाव आकार विश्वास अंतराल के भीतर नहीं है, तो परिणाम व्यावहारिक रूप से महत्वपूर्ण हो सकते हैं।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *