R की भिन्नता के गुणांक की गणना कैसे करें


भिन्नता का गुणांक , जिसे अक्सर सीवी के रूप में संक्षिप्त किया जाता है, माध्य के सापेक्ष डेटा सेट में मूल्यों के प्रसार को मापने का एक तरीका है। इसकी गणना इस प्रकार की जाती है:

सीवी = σ / μ

सोना:

  • σ: डेटासेट का मानक विचलन
  • μ: डेटा सेट का औसत

सीधे शब्दों में कहें तो भिन्नता का गुणांक केवल मानक विचलन और माध्य का अनुपात है।

भिन्नता के गुणांक का उपयोग कब करें

भिन्नता के गुणांक का उपयोग अक्सर डेटा के दो अलग-अलग सेटों के बीच भिन्नता की तुलना करने के लिए किया जाता है।

वास्तविक दुनिया में, निवेश के अपेक्षित मानक विचलन के विरुद्ध निवेश के औसत अपेक्षित रिटर्न की तुलना करने के लिए इसका उपयोग अक्सर वित्त में किया जाता है। यह निवेशकों को निवेश के बीच जोखिम-रिटर्न ट्रेडऑफ़ की तुलना करने की अनुमति देता है।

उदाहरण के लिए, मान लीजिए कि कोई निवेशक निम्नलिखित दो म्यूचुअल फंड में निवेश करने पर विचार कर रहा है:

म्यूचुअल फंड ए: माध्य = 9%, मानक विचलन = 12.4%

यूसीआईटीएस बी: औसत = 5%, मानक विचलन = 8.2%

प्रत्येक फंड की भिन्नता के गुणांक की गणना करके, निवेशक नोट करता है:

म्यूचुअल फंड ए के लिए सीवी = 12.4% /9% = 1.38

म्यूचुअल फंड बी के लिए सीवी = 8.2% / 5% = 1.64

चूंकि म्यूचुअल फंड ए में भिन्नता का गुणांक कम है, यह मानक विचलन के सापेक्ष बेहतर औसत रिटर्न प्रदान करता है।

R की भिन्नता के गुणांक की गणना कैसे करें

आर में डेटा सेट की भिन्नता के गुणांक की गणना करने के लिए, आप निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 cv <- sd(data) / mean(data) * 100

निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण 1: एकल वेक्टर के लिए भिन्नता का गुणांक

निम्नलिखित कोड दिखाता है कि एकल वेक्टर के लिए सीवी की गणना कैसे करें:

 #create vector of data
data <- c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81, 82)

#calculate CV
cv <- sd(data) / mean(data) * 100

#display CV
resume

[1] 9.234518

भिन्नता का गुणांक 9.23 निकला।

उदाहरण 2: कई सदिशों के लिए भिन्नता का गुणांक

निम्नलिखित कोड दिखाता है कि sapply() फ़ंक्शन का उपयोग करके डेटा फ़्रेम में एकाधिक वैक्टर के सीवी की गणना कैसे करें:

 #create data frame
data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95),
                   b=c(77, 88, 85, 76, 81, 82, 88, 91, 92, 99),
                   c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, 84))

#calculate CV for each column in data frame
sapply(data, function (x) sd(x) / mean(x) * 100 )

        ABC
11.012892 8.330843 7.154009

यदि आपके डेटा में भी मान गायब हैं तो na.rm=T का उपयोग करना सुनिश्चित करें। यह आर को भिन्नता के गुणांक की गणना करते समय लापता मानों को अनदेखा करने के लिए कहता है:

 #create data frame
data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95),
                   b=c(77, 88, 85, 76, 81, 82, 88, 91, NA , 99),
                   c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, NA ))

#calculate CV for each column in data frame
sapply(data, function (x) sd(x, na.rm= T ) / mean(x, na.rm= T ) * 100 )

        ABC
11.012892 8.497612 5.860924

अतिरिक्त संसाधन

आर में पूर्ण माध्य विचलन की गणना कैसे करें
आर में मानक विचलन की गणना कैसे करें
आर में रेंज कैसे खोजें?

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *