एसपीएसएस में महालनोबिस दूरी की गणना कैसे करें
महालनोबिस दूरी एक बहुभिन्नरूपी स्थान में दो बिंदुओं के बीच की दूरी है। इसका उपयोग अक्सर कई चर वाले सांख्यिकीय विश्लेषणों में आउटलेर्स का पता लगाने के लिए किया जाता है।
यह ट्यूटोरियल बताता है कि एसपीएसएस में महालनोबिस दूरी की गणना कैसे करें।
उदाहरण: एसपीएसएस में महालनोबिस दूरी
मान लीजिए कि हमारे पास निम्नलिखित डेटासेट है जो 20 छात्रों के परीक्षा स्कोर के साथ-साथ उनके अध्ययन में बिताए गए घंटों की संख्या, उनके द्वारा दी गई अभ्यास परीक्षाओं की संख्या और पाठ्यक्रम में उनके वर्तमान ग्रेड को प्रदर्शित करता है:
हम यह निर्धारित करने के लिए डेटासेट में प्रत्येक अवलोकन के लिए महालनोबिस दूरी की गणना करने के लिए निम्नलिखित चरणों का उपयोग कर सकते हैं कि क्या कोई बहुभिन्नरूपी आउटलेर हैं।
चरण 1: रैखिक प्रतिगमन विकल्प का चयन करें।
विश्लेषण टैब पर क्लिक करें, फिर प्रतिगमन , फिर रैखिक :
चरण 2: महालनोबिस विकल्प चुनें।
प्रतिक्रिया चर स्कोर को आश्रित लेबल वाले बॉक्स में खींचें। अन्य तीन भविष्यवक्ता चर को इंडिपेंडेंट लेबल वाले बॉक्स में खींचें। फिर सेव बटन पर क्लिक करें। दिखाई देने वाली नई विंडो में, सुनिश्चित करें कि महालनोबिस के बगल वाला बॉक्स चेक किया गया है। फिर जारी रखें पर क्लिक करें. फिर ओके पर क्लिक करें.
एक बार जब आप ओके पर क्लिक करते हैं, तो डेटासेट में प्रत्येक अवलोकन के लिए महालनोबिस दूरी MAH_1 नामक एक नए कॉलम में दिखाई देगी:
हम देख सकते हैं कि कुछ दूरियाँ दूसरों की तुलना में बहुत अधिक हैं। यह निर्धारित करने के लिए कि क्या कोई दूरी सांख्यिकीय रूप से महत्वपूर्ण है, हमें उनके पी-मानों की गणना करने की आवश्यकता है।
चरण 3: प्रत्येक महालनोबिस दूरी के पी-मान की गणना करें।
ट्रांसफ़ॉर्मेशन टैब पर क्लिक करें, फिर कैलकुलेट वेरिएबल पर क्लिक करें ।
टारगेट वेरिएबल बॉक्स में, आप जो वेरिएबल बना रहे हैं उसके लिए एक नया नाम चुनें। हम बात करते हैं “मूल्य”। संख्यात्मक अभिव्यक्ति बॉक्स में, निम्नलिखित दर्ज करें:
1 – CDF.CHISQ(MAH_1, 3)
फिर ओके पर क्लिक करें.
यह एक पी-वैल्यू उत्पन्न करेगा जो 3 डिग्री स्वतंत्रता के साथ ची-स्क्वायर मान से मेल खाता है। हम स्वतंत्रता की 3 डिग्री का उपयोग करते हैं क्योंकि हमारे प्रतिगमन मॉडल में 3 भविष्यवक्ता चर हैं।
चरण 4: पी-मानों की व्याख्या करें।
एक बार जब आप ओके पर क्लिक करते हैं, तो प्रत्येक महालनोबिस दूरी के लिए पी-वैल्यू एक नए कॉलम में प्रदर्शित किया जाएगा:
डिफ़ॉल्ट रूप से, एसपीएसएस केवल दो दशमलव स्थानों के साथ पी-मान प्रदर्शित करता है। आप एसपीएसएस के नीचे प्रदर्शन चर पर क्लिक करके और दशमलव स्थान कॉलम में संख्या बढ़ाकर दशमलव स्थानों की संख्या बढ़ा सकते हैं:
एक बार जब आप डेटा दृश्य पर वापस आते हैं, तो आप प्रत्येक पी-मान को पांच दशमलव स्थानों के साथ प्रदर्शित देख सकते हैं। 0.001 से कम किसी भी पी-वैल्यू को आउटलायर माना जाता है।
हम देख सकते हैं कि पहला अवलोकन डेटासेट में एकमात्र बाहरी है क्योंकि इसका पी-मान 0.001 से कम है:
आउटलेर्स को कैसे संभालें
यदि आपके डेटा में कोई बाहरी चीज़ मौजूद है, तो आपके पास कई विकल्प हैं:
1. सुनिश्चित करें कि बाहरी डेटा प्रविष्टि त्रुटि का परिणाम नहीं है।
कभी-कभी कोई व्यक्ति डेटा सहेजते समय गलत डेटा मान दर्ज कर देता है। यदि कोई बाहरी चीज़ मौजूद है, तो पहले सत्यापित करें कि डेटा मान सही ढंग से दर्ज किया गया था और यह कोई त्रुटि नहीं थी।
2. बाहरी हिस्से को हटा दें.
यदि मान वास्तव में एक बाहरी है, तो आप इसे हटाने का विकल्प चुन सकते हैं यदि इसका आपके समग्र विश्लेषण पर महत्वपूर्ण प्रभाव पड़ेगा। बस अपनी अंतिम रिपोर्ट या विश्लेषण में यह उल्लेख करना सुनिश्चित करें कि आपने एक बाहरी चीज़ हटा दी है।