आर में डेसील्स की गणना कैसे करें (उदाहरण के साथ)
आँकड़ों में, डेसील्स वे संख्याएँ हैं जो डेटा सेट को समान आवृत्ति के दस समूहों में विभाजित करती हैं।
पहला दशमलव वह बिंदु है जहां सभी डेटा मानों का 10% नीचे आता है। दूसरा दशमलव वह बिंदु है जहां सभी डेटा मानों का 20% नीचे गिरता है, इत्यादि।
हम R में डेटासेट के डेसील की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
quantile(data, probs = seq (.1, .9, by = .1 ))
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।
उदाहरण: आर में डेसील की गणना करें
निम्नलिखित कोड दिखाता है कि 20 मानों के साथ नकली डेटासेट कैसे बनाएं और फिर डेटासेट के दशमलव मानों की गणना कैसे करें:
#create dataset data <- c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88, 89, 90, 91, 92, 93, 93, 94, 95, 97, 99) #calculate deciles of dataset quantile(data, probs = seq (.1, .9, by = .1 )) 10% 20% 30% 40% 50% 60% 70% 80% 90% 63.4 67.8 76.5 83.6 88.5 90.4 92.3 93.2 95.2
डेसिल्स की व्याख्या करने का तरीका इस प्रकार है:
- सभी डेटा मानों का 10% 63.4 से कम है
- सभी डेटा मानों में से 20% 67.8 से कम हैं।
- सभी डेटा मानों का 30% 76.5 से कम है।
- सभी डेटा मानों का 40% 83.6 से कम है।
- सभी डेटा मानों में से 50% 88.5 से कम हैं।
- सभी डेटा मानों में से 60% 90.4 से कम हैं।
- सभी डेटा मानों का 70% 92.3 से कम है।
- सभी डेटा मानों में से 80% 93.2 से कम हैं।
- सभी डेटा मानों का 90% 95.2 से कम है।
यह ध्यान दिया जाना चाहिए कि 50वें प्रतिशतक का मान डेटासेट के औसत मान के बराबर है।
उदाहरण: R में मानों को दशमलव में रखना
प्रत्येक डेटा मान को डेसील में रखने के लिए, हम R में dplyr पैकेज से ntile(x, ngroups) फ़ंक्शन का उपयोग कर सकते हैं।
पिछले उदाहरण में हमारे द्वारा बनाए गए डेटासेट के लिए इस फ़ंक्शन का उपयोग कैसे करें:
library (dplyr) #create dataset data <- data.frame(values=c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88, 89, 90, 91, 92, 93, 93, 94, 95, 97, 99)) #place each value into a decile data$decile <- ntile(data, 10) #viewdata data values decile 1 56 1 2 58 1 3 64 2 4 67 2 5 68 3 6 73 3 7 78 4 8 83 4 9 84 5 10 88 5 11 89 6 12 90 6 13 91 7 14 92 7 15 93 8 16 93 8 17 94 9 18 95 9 19 97 10 20 99 10
परिणाम की व्याख्या करने का तरीका इस प्रकार है:
- डेटा मान 56 0% और 10% प्रतिशतक के बीच है, इसलिए यह पहले दशमलव में है।
- डेटा मान 58 0% और 10% प्रतिशतक के बीच है, इसलिए यह पहले दशमलव में है।
- डेटा मान 64 10% और 20% प्रतिशतक के बीच है, इसलिए यह दूसरे दशमलव में है।
- डेटा मान 67 10% और 20% प्रतिशतक के बीच है, इसलिए यह दूसरे दशमलव में है।
- डेटा मान 68 20% और 30% प्रतिशतक के बीच है, इसलिए यह तीसरे दशमलव में है।
और इसी तरह।
अतिरिक्त संसाधन
आर में प्रतिशतक की गणना कैसे करें
आर में चतुर्थक की गणना कैसे करें
आर में फ़्रीक्वेंसी टेबल कैसे बनाएं