गैर-पैरामीट्रिक आँकड़े
इस लेख में हम बताते हैं कि गैर-पैरामीट्रिक आँकड़े क्या हैं और उनका उपयोग किस लिए किया जाता है। आप गैर-पैरामीट्रिक आंकड़ों के अनुप्रयोग का एक उदाहरण भी देख पाएंगे और इसके अलावा, गैर-पैरामीट्रिक आंकड़ों और पैरामीट्रिक आंकड़ों के बीच क्या अंतर है।
गैरपैरामीट्रिक आँकड़े क्या हैं?
नॉनपैरामीट्रिक आँकड़े अनुमानित आँकड़ों की शाखा है जो उन चरों का अध्ययन करती है जो संभाव्यता वितरण में फिट नहीं होते हैं या जिनके वितरण के पैरामीटर परिभाषित नहीं हैं। अर्थात्, गैर-पैरामीट्रिक आँकड़ों का उपयोग उन चरों के लिए किया जाता है जिन्हें सैद्धांतिक मॉडल के साथ परिभाषित नहीं किया जा सकता है।
इस प्रकार, गैरपैरामीट्रिक आँकड़ों में उपयोग किए गए वितरण को प्राथमिकता से परिभाषित नहीं किया जा सकता है, बल्कि देखे गए डेटा उन्हें निर्धारित करते हैं।
गैर-पैरामीट्रिक सांख्यिकीय विधियों का उपयोग आम तौर पर तब किया जाता है जब कुछ परीक्षणों की पिछली धारणाएँ पूरी नहीं होती हैं, क्योंकि पैरामीट्रिक आँकड़ों के लिए आम तौर पर कुछ निश्चित धारणाएँ बनाने की आवश्यकता होती है। नीचे हम देखेंगे कि गैर-पैरामीट्रिक सांख्यिकी और पैरामीट्रिक सांख्यिकी के बीच क्या अंतर हैं।
इस प्रकार, गैर-पैरामीट्रिक आँकड़ों का उपयोग उन आबादी का अध्ययन करने के लिए किया जाता है जिनकी रेटिंग होती है, जैसे कि फिल्म समीक्षाएँ जो एक से पाँच स्टार प्राप्त करती हैं। गैरपैरामीट्रिक आँकड़ों का एक अन्य अनुप्रयोग तब होता है जब डेटा की रैंकिंग होती है लेकिन कोई स्पष्ट संख्यात्मक व्याख्या नहीं होती है, जैसे कि प्राथमिकताओं का आकलन करते समय।
गैरपैरामीट्रिक आँकड़ों का उदाहरण
एक बार जब हमने गैरपैरामीट्रिक आंकड़ों की परिभाषा देख ली, तो हम अवधारणा को पूरी तरह से समझने के लिए इसके अनुप्रयोग का एक उदाहरण देखेंगे।
कल्पना कीजिए कि हमारे पास 99 अवलोकनों वाला एक सांख्यिकीय नमूना है और हम अगले अवलोकन (अवलोकन संख्या 100) के मूल्य की संभावना निर्धारित करना चाहते हैं।
यदि हम पैरामीट्रिक सांख्यिकी का उपयोग करते हैं, तो हम पहले नमूने की विशेषताओं को जानने के लिए उसके कई सांख्यिकीय मापदंडों की गणना करेंगे। फिर हम अगले अवलोकन के मूल्य की संभावना निर्धारित करने के लिए गणना किए गए मापदंडों का उपयोग करके विभिन्न सांख्यिकीय परीक्षण कर सकते हैं।
हालाँकि, गैरपैरामीट्रिक आँकड़ों के लिए धन्यवाद, हम नमूने के सांख्यिकीय मापदंडों की गणना किए बिना अगले मूल्य के बारे में जानकारी जान सकते हैं।
उदाहरण के लिए, यदि हमारे पास 99 अवलोकनों का एक नमूना है, तो गैरपैरामीट्रिक आंकड़ों के साथ हम यह निर्धारित कर सकते हैं कि 1% संभावना है कि अवलोकन संख्या 100 पिछले सभी से अधिक है। इस प्रकार, किसी नमूने की अधिकतम मात्रा का गैर-पैरामीट्रिक अनुमान लगाया जा सकता है।
संक्षेप में, गैरपैरामीट्रिक आँकड़ों से हम नमूने के सांख्यिकीय मापदंडों को जानने की आवश्यकता के बिना संभावनाओं की गणना कर सकते हैं और अनुमान लगा सकते हैं।
गैर-पैरामीट्रिक सांख्यिकीय परीक्षण
गैर-पैरामीट्रिक परीक्षण गैर-पैरामीट्रिक आँकड़ों पर आधारित सांख्यिकीय विधियाँ हैं। इसलिए, गैरपैरामीट्रिक परीक्षणों में, संभाव्यता वितरण के बारे में धारणा बनाए बिना चर का मूल्यांकन किया जाता है।
सबसे प्रसिद्ध गैर-पैरामीट्रिक परीक्षण निम्नलिखित हैं:
- ची – वर्ग परीक्षण
- द्विपद परीक्षण
- विलकॉक्सन ने रैंक टेस्ट पर हस्ताक्षर किए
- माध्यिका परीक्षण
- एंडरसन-डार्लिंग परीक्षण
- कोचरन परीक्षण
- कोहेन का कप्पा परीक्षण
- फिशर परीक्षण
- फ्रीडमैन परीक्षण
- केंडल परीक्षण
- कोलमोगोरोव-स्मिरनोव परीक्षण
- कुइपर परीक्षण
- मैन-व्हिटनी परीक्षण या विलकॉक्सन परीक्षण
- मैकनेमर परीक्षण
- सीगल-टुकी परीक्षण
- हस्ताक्षर परीक्षण
- वाल्ड-वुल्फोवित्ज़ परीक्षण
गैर-पैरामीट्रिक आंकड़ों के फायदे और नुकसान
पैरामीट्रिक आँकड़ों की तुलना में, गैर-पैरामीट्रिक आँकड़ों के फायदे और नुकसान इस प्रकार हैं:
फ़ायदा:
- गैर-पैरामीट्रिक आँकड़े संख्यात्मक और गैर-संख्यात्मक डेटा पर लागू किए जा सकते हैं।
- सामान्य तौर पर, गैरपैरामीट्रिक परीक्षणों को पूर्व मान्यताओं को पूरा करना जरूरी नहीं है, जो उन्हें अधिक स्थितियों में उपयोग करने की अनुमति देता है।
- जब नमूना आकार छोटा होता है, तो गैर-पैरामीट्रिक परीक्षण आम तौर पर जल्दी लागू होते हैं।
नुकसान:
- कभी-कभी जानकारी खो सकती है क्योंकि डेटा को गुणात्मक जानकारी में बदल दिया जाता है।
- जब नमूना आकार बड़ा होता है, तो गैर-पैरामीट्रिक परीक्षण करना बहुत श्रमसाध्य होता है।
- गैर-पैरामीट्रिक परीक्षणों में आम तौर पर कम शक्ति होती है, जिसका अर्थ है कि समान स्तर के आत्मविश्वास के साथ निष्कर्ष निकालने के लिए एक बड़े नमूना आकार की आवश्यकता होती है।
गैर-पैरामीट्रिक आँकड़े और पैरामीट्रिक आँकड़े
अंत में, संक्षेप में, आइए देखें कि गैर-पैरामीट्रिक सांख्यिकी और पैरामीट्रिक सांख्यिकी के बीच क्या अंतर है।
पैरामीट्रिक आँकड़े अनुमानित आँकड़ों की शाखा है जो मानती है कि डेटा को संभाव्यता वितरण द्वारा मॉडल किया जा सकता है। उदाहरण के लिए, छात्र का t परीक्षण एक पैरामीट्रिक परीक्षण है क्योंकि यह छात्र के t संभाव्यता वितरण का उपयोग करता है।
गैर-पैरामीट्रिक आँकड़ों और पैरामीट्रिक आँकड़ों के बीच अंतर यह है कि वे सैद्धांतिक मॉडल पर आधारित हैं या नहीं। गैर-पैरामीट्रिक आँकड़े उन चरों का अध्ययन करते हैं जो संभाव्यता वितरण में फिट नहीं होते हैं, जबकि पैरामीट्रिक आँकड़े परिभाषित संभाव्यता वितरण का उपयोग करते हैं।