R की भिन्नता के गुणांक की गणना कैसे करें
भिन्नता का गुणांक , जिसे अक्सर सीवी के रूप में संक्षिप्त किया जाता है, माध्य के सापेक्ष डेटा सेट में मूल्यों के प्रसार को मापने का एक तरीका है। इसकी गणना इस प्रकार की जाती है:
सीवी = σ / μ
सोना:
- σ: डेटासेट का मानक विचलन
- μ: डेटा सेट का औसत
सीधे शब्दों में कहें तो भिन्नता का गुणांक केवल मानक विचलन और माध्य का अनुपात है।
भिन्नता के गुणांक का उपयोग कब करें
भिन्नता के गुणांक का उपयोग अक्सर डेटा के दो अलग-अलग सेटों के बीच भिन्नता की तुलना करने के लिए किया जाता है।
वास्तविक दुनिया में, निवेश के अपेक्षित मानक विचलन के विरुद्ध निवेश के औसत अपेक्षित रिटर्न की तुलना करने के लिए इसका उपयोग अक्सर वित्त में किया जाता है। यह निवेशकों को निवेश के बीच जोखिम-रिटर्न ट्रेडऑफ़ की तुलना करने की अनुमति देता है।
उदाहरण के लिए, मान लीजिए कि कोई निवेशक निम्नलिखित दो म्यूचुअल फंड में निवेश करने पर विचार कर रहा है:
म्यूचुअल फंड ए: माध्य = 9%, मानक विचलन = 12.4%
यूसीआईटीएस बी: औसत = 5%, मानक विचलन = 8.2%
प्रत्येक फंड की भिन्नता के गुणांक की गणना करके, निवेशक नोट करता है:
म्यूचुअल फंड ए के लिए सीवी = 12.4% /9% = 1.38
म्यूचुअल फंड बी के लिए सीवी = 8.2% / 5% = 1.64
चूंकि म्यूचुअल फंड ए में भिन्नता का गुणांक कम है, यह मानक विचलन के सापेक्ष बेहतर औसत रिटर्न प्रदान करता है।
R की भिन्नता के गुणांक की गणना कैसे करें
आर में डेटा सेट की भिन्नता के गुणांक की गणना करने के लिए, आप निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
cv <- sd(data) / mean(data) * 100
निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।
उदाहरण 1: एकल वेक्टर के लिए भिन्नता का गुणांक
निम्नलिखित कोड दिखाता है कि एकल वेक्टर के लिए सीवी की गणना कैसे करें:
#create vector of data data <- c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81, 82) #calculate CV cv <- sd(data) / mean(data) * 100 #display CV resume [1] 9.234518
भिन्नता का गुणांक 9.23 निकला।
उदाहरण 2: कई सदिशों के लिए भिन्नता का गुणांक
निम्नलिखित कोड दिखाता है कि sapply() फ़ंक्शन का उपयोग करके डेटा फ़्रेम में एकाधिक वैक्टर के सीवी की गणना कैसे करें:
#create data frame data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95), b=c(77, 88, 85, 76, 81, 82, 88, 91, 92, 99), c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, 84)) #calculate CV for each column in data frame sapply(data, function (x) sd(x) / mean(x) * 100 ) ABC 11.012892 8.330843 7.154009
यदि आपके डेटा में भी मान गायब हैं तो na.rm=T का उपयोग करना सुनिश्चित करें। यह आर को भिन्नता के गुणांक की गणना करते समय लापता मानों को अनदेखा करने के लिए कहता है:
#create data frame data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95), b=c(77, 88, 85, 76, 81, 82, 88, 91, NA , 99), c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, NA )) #calculate CV for each column in data frame sapply(data, function (x) sd(x, na.rm= T ) / mean(x, na.rm= T ) * 100 ) ABC 11.012892 8.497612 5.860924
अतिरिक्त संसाधन
आर में पूर्ण माध्य विचलन की गणना कैसे करें
आर में मानक विचलन की गणना कैसे करें
आर में रेंज कैसे खोजें?