पायथन में डेसील्स की गणना कैसे करें: उदाहरणों के साथ
आँकड़ों में, डेसील्स वे संख्याएँ हैं जो डेटा सेट को समान आवृत्ति के दस समूहों में विभाजित करती हैं।
पहला दशमलव वह बिंदु है जहां सभी डेटा मानों का 10% नीचे आता है। दूसरा दशमलव वह बिंदु है जहां सभी डेटा मानों का 20% नीचे गिरता है, इत्यादि।
हम पायथन में डेटासेट के डेसील की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
import numpy as np n.p. percentile (var, np. arange (0, 100, 10))
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।
उदाहरण: पायथन में डेसील्स की गणना करें
निम्नलिखित कोड दिखाता है कि 20 मानों के साथ नकली डेटासेट कैसे बनाएं और फिर डेटासेट के दशमलव मानों की गणना कैसे करें:
import numpy as np
#createdata
data = np. array ([56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
89, 90, 91, 92, 93, 93, 94, 95, 97, 99])
#calculate deciles of data
n.p. percentile (data, np. arange (0, 100, 10))
array([56., 63.4, 67.8, 76.5, 83.6, 88.5, 90.4, 92.3, 93.2, 95.2])
डेसिल्स की व्याख्या करने का तरीका इस प्रकार है:
- सभी डेटा मानों का 10% 63.4 से कम है
- सभी डेटा मानों में से 20% 67.8 से कम हैं।
- सभी डेटा मानों का 30% 76.5 से कम है।
- सभी डेटा मानों का 40% 83.6 से कम है।
- सभी डेटा मानों में से 50% 88.5 से कम हैं।
- सभी डेटा मानों में से 60% 90.4 से कम हैं।
- सभी डेटा मानों का 70% 92.3 से कम है।
- सभी डेटा मानों में से 80% 93.2 से कम हैं।
- सभी डेटा मानों का 90% 95.2 से कम है।
ध्यान दें कि आउटपुट का पहला मान (56) केवल डेटा सेट के न्यूनतम मान को इंगित करता है।
उदाहरण: पायथन में डेसील्स में मान रखना
प्रत्येक डेटा मान को डेसील में रखने के लिए, हम पांडा क्यूकट फ़ंक्शन का उपयोग कर सकते हैं।
पिछले उदाहरण में हमारे द्वारा बनाए गए डेटासेट के लिए इस फ़ंक्शन का उपयोग कैसे करें:
import pandas as pd
#create data frame
df = pd. DataFrame ({' values ': [56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
89, 90, 91, 92, 93, 93, 94, 95, 97, 99]})
#calculate decile of each value in data frame
df[' Decile '] = pd. qcut (df[' values '], 10, labels= False )
#display data frame
df
values Decile
0 56 0
1 58 0
2 64 1
3 67 1
4 68 2
5 73 2
6 78 3
7 83 3
8 84 4
9 88 4
10 89 5
11 90 5
12 91 6
13 92 6
14 93 7
15 93 7
16 94 8
17 95 8
18 97 9
19 99 9
परिणाम की व्याख्या करने का तरीका इस प्रकार है:
- डेटा मान 56 प्रतिशतक 0% और 10% के बीच है, इसलिए यह दशमलव 0 में है।
- डेटा मान 58 प्रतिशतक 0% और 10% के बीच है, इसलिए यह दशमलव 0 में है।
- डेटा मान 64 10% और 20% प्रतिशत के बीच है, इसलिए यह डेसील 1 में है।
- डेटा मान 67 10% और 20% प्रतिशतक के बीच आता है, इसलिए यह दशमलव 1 में आता है।
- डेटा मान 68 20% और 30% प्रतिशतक के बीच आता है, इसलिए यह दशमलव 2 में आता है।
और इसी तरह।
अतिरिक्त संसाधन
पायथन में प्रतिशत की गणना कैसे करें
पायथन में इंटरक्वेर्टाइल रेंज की गणना कैसे करें