पांडा: विशिष्ट प्रतिशतक के साथ वर्णन() का उपयोग कैसे करें
आप पांडा डेटाफ़्रेम में चर के लिए वर्णनात्मक आँकड़े उत्पन्न करने के लिए वर्णन() फ़ंक्शन का उपयोग कर सकते हैं।
डिफ़ॉल्ट रूप से, पांडा चर के लिए 25वें, 50वें और 75वें प्रतिशतक की गणना करता है।
हालाँकि, आप गणना करने के लिए सटीक प्रतिशत निर्दिष्ट करने के लिए वर्णन () फ़ंक्शन में प्रतिशत तर्क का उपयोग कर सकते हैं।
निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित पांडा डेटाफ़्रेम के साथ व्यवहार में इस तर्क का उपयोग कैसे करें:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
' points ': [18, 22, 19, 14, 14, 11, 20, 28],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#view DataFrame
print (df)
team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12
उदाहरण 1: डिफ़ॉल्ट प्रतिशतक के साथ विवरण() का उपयोग करना
निम्नलिखित कोड दिखाता है कि डेटाफ़्रेम में प्रत्येक संख्यात्मक चर के लिए वर्णनात्मक आंकड़ों की गणना करने के लिए वर्णन() फ़ंक्शन का उपयोग कैसे करें:
#calculate descriptive statistics for each numeric variable
df. describe ()
points assists rebounds
count 8.000000 8.00000 8.000000
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
min 11.000000 4.00000 5.000000
25% 14,000000 6,50000 6,000000
50% 18.500000 8.00000 8.500000
75% 20.500000 9.00000 10.250000
max 28.000000 12.00000 12.000000
ध्यान दें कि वर्णन() फ़ंक्शन डिफ़ॉल्ट रूप से प्रत्येक चर के लिए 25वें, 50वें और 75वें प्रतिशतक की गणना करता है।
उदाहरण 2: कस्टम प्रतिशतक के साथ विवरण() का उपयोग करना
निम्नलिखित कोड दिखाता है कि डेटाफ़्रेम में प्रत्येक संख्यात्मक चर के लिए 30वें, 60वें और 90वें प्रतिशतक की गणना करने के लिए प्रतिशतक तर्क के साथ वर्णन() फ़ंक्शन का उपयोग कैसे करें:
#calculate custom percentiles for each numeric variable
df. describe (percentiles=[ .3 , .6 , .9 ])
points assists rebounds
count 8.000000 8.00000 8.000000
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
min 11.000000 4.00000 5.000000
30% 14.400000 7.00000 6.200000
50% 18.500000 8.00000 8.500000
60% 19.200000 9.00000 9.200000
90% 23.800000 9.90000 11.300000
max 28.000000 12.00000 12.000000
ध्यान दें कि डिस्क्रिप्शन() फ़ंक्शन प्रत्येक संख्यात्मक चर के लिए 30वां, 60वां और 90वां प्रतिशत लौटाता है।
नोट : वर्णन() फ़ंक्शन 50वां प्रतिशत भी लौटाता है क्योंकि यह प्रत्येक चर के औसत मूल्य का प्रतिनिधित्व करता है और वर्णन() फ़ंक्शन द्वारा गणना की गई डिफ़ॉल्ट मीट्रिक में से एक है।
उदाहरण 3: प्रतिशतक के बिना वर्णन() का उपयोग करना
निम्नलिखित कोड दिखाता है कि डेटाफ़्रेम में प्रत्येक संख्यात्मक चर के लिए कोई प्रतिशतक की गणना करने के लिए प्रतिशत = [] तर्क के साथ वर्णन() फ़ंक्शन का उपयोग कैसे करें:
#calculate no percentiles for each numeric variable
df. describe (percentiles=[])
points assists rebounds
count 8.000000 8.00000 8.000000
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
min 11.000000 4.00000 5.000000
50% 18.500000 8.00000 8.500000
max 28.000000 12.00000 12.000000
ध्यान दें कि 25वें और 75वें प्रतिशतक की गणना अब प्रत्येक चर के लिए नहीं की जाती है।
ध्यान दें कि 50वां प्रतिशत हमेशा परिणाम में शामिल होता है क्योंकि यह प्रत्येक चर के औसत मूल्य का प्रतिनिधित्व करता है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:
पांडा: समूह द्वारा वर्णन() का उपयोग कैसे करें
पांडा: वर्णन() का उपयोग कैसे करें और वैज्ञानिक संकेतन कैसे हटाएं
पांडा: माध्य, माध्यिका और बहुलक की गणना कैसे करें