आर में तिरछापन और कर्टोसिस की गणना कैसे करें


आंकड़ों में, तिरछापन और कुर्टोसिस वितरण के आकार को मापने के दो तरीके हैं।

विषमता किसी वितरण की विषमता का माप है। यह मान धनात्मक अथवा ऋणात्मक हो सकता है।

  • नकारात्मक तिरछापन इंगित करता है कि पूंछ वितरण के बाईं ओर है, जो अधिक नकारात्मक मूल्यों की ओर बढ़ती है।
  • एक सकारात्मक तिरछा इंगित करता है कि पूंछ वितरण के दाईं ओर है, जो अधिक सकारात्मक मूल्यों की ओर बढ़ती है।
  • शून्य का मान इंगित करता है कि वितरण में कोई विषमता नहीं है, जिसका अर्थ है कि वितरण पूरी तरह से सममित है।

कर्टोसिस इस बात का माप है कि कोई वितरण सामान्य वितरण की तुलना में भारी है या हल्का।

  • सामान्य वितरण का कुर्टोसिस 3 है।
  • यदि किसी दिए गए वितरण में कर्टोसिस 3 से कम है, तो इसे प्लेकर्टिक कहा जाता है, जिसका अर्थ है कि यह सामान्य वितरण की तुलना में कम और कम चरम आउटलेर उत्पन्न करता है।
  • यदि किसी दिए गए वितरण में कर्टोसिस 3 से अधिक है, तो इसे लेप्टोकर्टिक कहा जाता है, जिसका अर्थ है कि यह सामान्य वितरण की तुलना में अधिक आउटलेर्स उत्पन्न करता है।

नोट: कुछ सूत्र (फिशर परिभाषा) सामान्य वितरण के साथ तुलना करना आसान बनाने के लिए कर्टोसिस से 3 घटाते हैं। इस परिभाषा का उपयोग करते हुए, एक वितरण में सामान्य वितरण की तुलना में अधिक कर्टोसिस होगा यदि उसका कर्टोसिस मान 0 से अधिक हो।

यह ट्यूटोरियल बताता है कि आर में दिए गए डेटासेट की तिरछापन और कर्टोसिस दोनों की गणना कैसे करें।

उदाहरण: आर में तिरछापन और चपटापन

मान लीजिए हमारे पास निम्नलिखित डेटा सेट है:

 data = c(88, 95, 92, 97, 96, 97, 94, 86, 91, 95, 97, 88, 85, 76, 68)

हम हिस्टोग्राम बनाकर इस डेटासेट में मूल्यों के वितरण की शीघ्रता से कल्पना कर सकते हैं:

 hist(data, col=' steelblue ') 

आर में तिरछापन और कुर्टोसिस

हिस्टोग्राम हमें दिखाता है कि वितरण बाईं ओर झुका हुआ प्रतीत होता है। अर्थात्, मूल्यों का एक बड़ा हिस्सा वितरण के दाईं ओर केंद्रित है।

इस डेटासेट की विषमता और कर्टोसिस की गणना करने के लिए, हम आर में पल लाइब्रेरी से तिरछापन () और कर्टोसिस () फ़ंक्शन का उपयोग कर सकते हैं:

 library (moments)

#calculate skewness
skewness(data)

[1] -1.391777

#calculate kurtosis
kurtosis(data)

[1] 4.177865

तिरछापन -1.391777 निकला और कुर्टोसिस 4.177865 निकला।

चूँकि विषमता ऋणात्मक है, यह इंगित करता है कि वितरण विषम रह गया है। यह पुष्टि करता है कि हमने हिस्टोग्राम में क्या देखा।

चूंकि कर्टोसिस 3 से अधिक है, यह इंगित करता है कि वितरण में सामान्य वितरण की तुलना में पूंछ में अधिक मूल्य हैं।

मोमेंट्स लाइब्रेरी Jarque.test() फ़ंक्शन भी प्रदान करती है, जो एक फिट-ऑफ-फिट परीक्षण करता है जो यह निर्धारित करता है कि नमूना डेटा सामान्य वितरण के अनुरूप तिरछापन और कर्टोसिस प्रदर्शित करता है या नहीं। इस परीक्षण की शून्य और वैकल्पिक परिकल्पनाएँ इस प्रकार हैं:

शून्य परिकल्पना : डेटा सेट में तिरछापन और कुर्टोसिस है जो सामान्य वितरण से मेल खाता है।

वैकल्पिक परिकल्पना : डेटासेट में तिरछापन और कुर्टोसिस है जो सामान्य वितरण के अनुरूप नहीं है

निम्नलिखित कोड दिखाता है कि यह परीक्षण कैसे करें:

 jarque.test(data)

	Jarque-Bera Normality Test

data:data
JB = 5.7097, p-value = 0.05756
alternative hypothesis: greater

परीक्षण का पी-मान 0.05756 निकला। चूँकि यह मान α = 0.05 से कम नहीं है, हम शून्य परिकल्पना को अस्वीकार करने में विफल हैं। हमारे पास यह कहने के लिए पर्याप्त सबूत नहीं हैं कि इस डेटासेट में सामान्य वितरण से अलग विषमता और कर्टोसिस है।

आप संपूर्ण मोमेंट्स लाइब्रेरी दस्तावेज़ यहां पा सकते हैं।

बोनस: तिरछापन और कर्टोसिस कैलकुलेटर

आप सांख्यिकीय तिरछापन और कर्टोसिस कैलकुलेटर का उपयोग करके किसी दिए गए डेटासेट के लिए तिरछापन की गणना भी कर सकते हैं , जो स्वचालित रूप से किसी दिए गए डेटासेट के लिए तिरछापन और कर्टोसिस की गणना करता है।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *