आर में डेसील्स की गणना कैसे करें (उदाहरण के साथ)


आँकड़ों में, डेसील्स वे संख्याएँ हैं जो डेटा सेट को समान आवृत्ति के दस समूहों में विभाजित करती हैं।

पहला दशमलव वह बिंदु है जहां सभी डेटा मानों का 10% नीचे आता है। दूसरा दशमलव वह बिंदु है जहां सभी डेटा मानों का 20% नीचे गिरता है, इत्यादि।

हम R में डेटासेट के डेसील की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 quantile(data, probs = seq (.1, .9, by = .1 ))

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।

उदाहरण: आर में डेसील की गणना करें

निम्नलिखित कोड दिखाता है कि 20 मानों के साथ नकली डेटासेट कैसे बनाएं और फिर डेटासेट के दशमलव मानों की गणना कैसे करें:

 #create dataset
data <- c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
          89, 90, 91, 92, 93, 93, 94, 95, 97, 99)

#calculate deciles of dataset
quantile(data, probs = seq (.1, .9, by = .1 ))

 10% 20% 30% 40% 50% 60% 70% 80% 90% 
63.4 67.8 76.5 83.6 88.5 90.4 92.3 93.2 95.2 

डेसिल्स की व्याख्या करने का तरीका इस प्रकार है:

  • सभी डेटा मानों का 10% 63.4 से कम है
  • सभी डेटा मानों में से 20% 67.8 से कम हैं।
  • सभी डेटा मानों का 30% 76.5 से कम है।
  • सभी डेटा मानों का 40% 83.6 से कम है।
  • सभी डेटा मानों में से 50% 88.5 से कम हैं।
  • सभी डेटा मानों में से 60% 90.4 से कम हैं।
  • सभी डेटा मानों का 70% 92.3 से कम है।
  • सभी डेटा मानों में से 80% 93.2 से कम हैं।
  • सभी डेटा मानों का 90% 95.2 से कम है।

यह ध्यान दिया जाना चाहिए कि 50वें प्रतिशतक का मान डेटासेट के औसत मान के बराबर है।

उदाहरण: R में मानों को दशमलव में रखना

प्रत्येक डेटा मान को डेसील में रखने के लिए, हम R में dplyr पैकेज से ntile(x, ngroups) फ़ंक्शन का उपयोग कर सकते हैं।

पिछले उदाहरण में हमारे द्वारा बनाए गए डेटासेट के लिए इस फ़ंक्शन का उपयोग कैसे करें:

 library (dplyr)

#create dataset
data <- data.frame(values=c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
                            89, 90, 91, 92, 93, 93, 94, 95, 97, 99))

#place each value into a decile
data$decile <- ntile(data, 10)

#viewdata
data

   values decile
1 56 1
2 58 1
3 64 2
4 67 2
5 68 3
6 73 3
7 78 4
8 83 4
9 84 5
10 88 5
11 89 6
12 90 6
13 91 7
14 92 7
15 93 8
16 93 8
17 94 9
18 95 9
19 97 10
20 99 10

परिणाम की व्याख्या करने का तरीका इस प्रकार है:

  • डेटा मान 56 0% और 10% प्रतिशतक के बीच है, इसलिए यह पहले दशमलव में है।
  • डेटा मान 58 0% और 10% प्रतिशतक के बीच है, इसलिए यह पहले दशमलव में है।
  • डेटा मान 64 10% और 20% प्रतिशतक के बीच है, इसलिए यह दूसरे दशमलव में है।
  • डेटा मान 67 10% और 20% प्रतिशतक के बीच है, इसलिए यह दूसरे दशमलव में है।
  • डेटा मान 68 20% और 30% प्रतिशतक के बीच है, इसलिए यह तीसरे दशमलव में है।

और इसी तरह।

अतिरिक्त संसाधन

आर में प्रतिशतक की गणना कैसे करें
आर में चतुर्थक की गणना कैसे करें
आर में फ़्रीक्वेंसी टेबल कैसे बनाएं

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *