स्थिति माप
यह आलेख बताता है कि स्थिति माप क्या हैं और उनका उपयोग किस लिए किया जाता है। तो आपको सभी स्थिति माप के साथ-साथ प्रत्येक प्रकार के उदाहरण भी मिलेंगे।
स्थिति माप क्या हैं?
स्थिति माप सांख्यिकीय पैरामीटर हैं जो डेटा के एक सेट को परिभाषित करने में मदद करते हैं। सीधे शब्दों में कहें तो स्थिति माप से हमें यह जानने में मदद मिलती है कि डेटा सेट कैसा दिखता है।
आंकड़ों में, स्थिति माप दो प्रकार के होते हैं: केंद्रीय स्थिति माप , जिसका उपयोग डेटा सेट के केंद्रीय मूल्यों को निर्धारित करने के लिए किया जाता है, और गैर-केंद्रीय स्थिति माप , जिसका उपयोग डेटा को समान अंतराल में विभाजित करने के लिए किया जाता है। .
स्थिति माप क्या हैं?
आंकड़ों में, स्थिति माप हैं:
- केंद्र स्थिति माप : वितरण के केंद्रीय मूल्यों को इंगित करें।
- औसत : यह नमूने के सभी डेटा का औसत है।
- माध्यिका : यह सबसे छोटे से सबसे बड़े तक क्रमित सभी डेटा का मध्य मान है।
- मोड : यह डेटासेट में सबसे अधिक दोहराया जाने वाला मान है।
- गैर-केंद्रीय स्थिति माप : डेटा सेट को समान भागों में विभाजित करें।
- चतुर्थक : डेटा नमूने को चार समान भागों में विभाजित करें।
- क्विंटाइल्स : डेटा को पांच बराबर भागों में अलग करें।
- डेसीलीस : डेटा सेट को समान परिमाण के दस अंतरालों में विभाजित करें।
- प्रतिशतक : डेटा को एक सौ समतुल्य भागों में विभाजित करें।
प्रत्येक प्रकार की स्थिति माप को नीचे अधिक विस्तार से समझाया गया है।
केंद्रीय स्थिति माप
केंद्र स्थिति माप किसी वितरण के केंद्रीय मूल्य को इंगित करता है, अर्थात, उनका उपयोग डेटा सेट के केंद्र के मूल्य प्रतिनिधि को खोजने के लिए किया जाता है। केंद्रीय स्थिति के मुख्य रूप से तीन माप हैं: माध्य, माध्यिका और बहुलक।
आधा
औसत की गणना करने के लिए, सभी मान जोड़ें और फिर अवलोकनों की कुल संख्या से विभाजित करें। इसलिए औसत का सूत्र इस प्रकार है:
औसत को अंकगणितीय माध्य या औसत के रूप में भी जाना जाता है। इसके अलावा, एक सांख्यिकीय वितरण का माध्य इसकी गणितीय अपेक्षा के बराबर है।
मंझला
माध्यिका सबसे छोटे से लेकर सबसे बड़े तक क्रमित सभी डेटा का मध्य मान है। दूसरे शब्दों में, माध्य क्रमित डेटा सेट को दो बराबर भागों में विभाजित करता है।
माध्यिका की गणना इस बात पर निर्भर करती है कि डेटा की कुल संख्या सम है या विषम:
- यदि डेटा की कुल संख्या विषम है, तो माध्यिका वह मान होगा जो डेटा के ठीक बीच में आता है। कहने का तात्पर्य यह है कि वह मान जो क्रमबद्ध डेटा की स्थिति (n+1)/2 में है।
- यदि डेटा बिंदुओं की कुल संख्या सम है, तो माध्य केंद्र में स्थित दो डेटा बिंदुओं का औसत होगा। यानी उन मानों का अंकगणितीय औसत जो ऑर्डर किए गए डेटा के स्थानों n/2 और n/2+1 पर पाए जाते हैं।
सोना
नमूने में डेटा की कुल संख्या है और मी माध्यिका है।
पहनावा
आंकड़ों में, मोड डेटा सेट में वह मान है जिसकी निरपेक्ष आवृत्ति सबसे अधिक है, अर्थात, मोड वह मान है जो डेटा सेट में सबसे अधिक दिखाई देता है।
इसलिए, सांख्यिकीय डेटा सेट के मोड की गणना करने के लिए, बस नमूने में प्रत्येक डेटा आइटम दिखाई देने की संख्या की गणना करें, और सबसे अधिक दोहराया जाने वाला डेटा आइटम मोड होगा।
मोड को सांख्यिकीय मोड या मोडल वैल्यू भी कहा जा सकता है।
सर्वाधिक दोहराए गए मानों की संख्या के अनुसार तीन प्रकार के मोड को प्रतिष्ठित किया जा सकता है:
- यूनिमॉडल मोड : अधिकतम संख्या में दोहराव के साथ केवल एक मान होता है। उदाहरण के लिए, [1, 4, 2, 4, 5, 3]।
- बिमोडल मोड : पुनरावृत्ति की अधिकतम संख्या दो अलग-अलग मानों पर होती है और दोनों मान समान संख्या में दोहराए जाते हैं। उदाहरण के लिए, [2, 6, 7, 2, 3, 6, 9]।
- मल्टीमॉडल मोड : तीन या अधिक मानों में दोहराव की अधिकतम संख्या समान होती है। उदाहरण के लिए, [3, 3, 4, 1, 3, 4, 2, 1, 4, 5, 2, 1]।
गैर-केंद्रीय स्थिति माप
गैर-केंद्रीय स्थिति माप का उपयोग सांख्यिकीय डेटा सेट को समान अंतराल में विभाजित करने के लिए किया जाता है। गैर-केंद्रीय स्थिति माप मुख्य रूप से चार प्रकार के होते हैं: चतुर्थक, क्विंटाइल, डेसील और प्रतिशतक।
चतुर्थक
आंकड़ों में, चतुर्थक तीन मान हैं जो डेटा सेट को चार बराबर भागों में विभाजित करते हैं। इस प्रकार, पहला, दूसरा और तीसरा चतुर्थक सभी सांख्यिकीय डेटा का क्रमशः 25%, 50% और 75% प्रतिनिधित्व करता है।
चतुर्थक को बड़े Q और चतुर्थक सूचकांक द्वारा दर्शाया जाता है, इसलिए पहला चतुर्थक Q 1 है, दूसरा चतुर्थक Q 2 है और तीसरा चतुर्थक Q 3 है।
Quintiles
क्विंटाइल्स चार मान हैं जो एक ऑर्डर किए गए डेटा सेट को पांच बराबर भागों में विभाजित करते हैं। इस प्रकार, पहला, दूसरा, तीसरा और चौथा क्विंटल क्रमशः 20%, 40%, 60% और 80% नमूना डेटा का प्रतिनिधित्व करता है।
उदाहरण के लिए, तीसरा क्विंटाइल एकत्र किए गए सभी डेटा के 60% से अधिक का प्रतिनिधित्व करता है, लेकिन बाकी डेटा से छोटा है।
क्विंटाइल का प्रतीक क्विंटाइल इंडेक्स के साथ बड़े अक्षर K है, यानी पहला क्विंटाइल K 1 है, दूसरा क्विंटाइल K 2 है, तीसरा क्विंटाइल K 3 है और चौथा क्विंटाइल K 4 है। हालाँकि इसे अक्षर Q द्वारा भी दर्शाया जा सकता है (अनुशंसित नहीं है क्योंकि यह चतुर्थक के साथ भ्रम पैदा करता है)।
दशमांश
डेसील्स नौ मान हैं जो ऑर्डर किए गए डेटा के एक सेट को दस बराबर भागों में विभाजित करते हैं। इस प्रकार पहला, दूसरा, तीसरा,… दशमलव नमूना या जनसंख्या के 10%, 20%, 30%,… का प्रतिनिधित्व करता है।
उदाहरण के लिए, चौथा दशमलव मान डेटा के 40% से अधिक है, लेकिन बाकी डेटा से कम है।
सामान्य तौर पर, डेसील को बड़े अक्षर D और डेसील इंडेक्स द्वारा दर्शाया जाता है, अर्थात, पहला डेसील D 1 है, दूसरा डेसील D 2 है, तीसरा डेसील D 3 है, आदि।
प्रतिशतक
प्रतिशतक वे मान हैं जो ऑर्डर किए गए डेटा के एक सेट को एक सौ बराबर भागों में विभाजित करते हैं। तो, एक प्रतिशतक उस मान को इंगित करता है जिसके नीचे डेटा सेट का एक प्रतिशत गिरता है।
उदाहरण के लिए, 35वां प्रतिशतक मान प्रेक्षित डेटा के 35% से अधिक है, लेकिन बाकी डेटा से कम है।
प्रतिशतक को बड़े अक्षर P और प्रतिशतक सूचकांक द्वारा दर्शाया जाता है, अर्थात, पहला प्रतिशतक P 1 है, 40वाँ प्रतिशतक P 40 है, 79वाँ प्रतिशतक P 79 है, इत्यादि।