पांडा: केवल मीन और एसटीडी के लिए वर्णन () का उपयोग कैसे करें
आप पांडा डेटाफ़्रेम में चर के लिए वर्णनात्मक आँकड़े उत्पन्न करने के लिए वर्णन() फ़ंक्शन का उपयोग कर सकते हैं।
डिफ़ॉल्ट रूप से, वर्णन() फ़ंक्शन डेटाफ़्रेम में प्रत्येक संख्यात्मक चर के लिए निम्नलिखित मीट्रिक की गणना करता है:
- गिनती (मूल्यों की संख्या)
- औसत (औसत मूल्य)
- एसटीडी (मानक विचलन)
- न्यूनतम (न्यूनतम मूल्य)
- 25% (25वाँ प्रतिशतक)
- 50% (50वाँ प्रतिशतक)
- 75% (75वाँ प्रतिशतक)
- अधिकतम (अधिकतम मान)
हालाँकि, आप प्रत्येक संख्यात्मक चर के केवल माध्य और मानक विचलन की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
df. describe (). loc [[' mean ', ' std ']]
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।
उदाहरण: केवल माध्य और मानक की गणना करने के लिए पांडा में विवरण() का उपयोग करें
मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम है जिसमें विभिन्न बास्केटबॉल खिलाड़ियों के बारे में जानकारी है:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
' points ': [18, 22, 19, 14, 14, 11, 20, 28],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#view DataFrame
print (df)
team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12
यदि हम वर्णन() फ़ंक्शन का उपयोग करते हैं, तो हम डेटाफ़्रेम में प्रत्येक संख्यात्मक चर के लिए वर्णनात्मक आंकड़ों की गणना कर सकते हैं:
#calculate descriptive statistics for each numeric variable
df. describe ()
points assists rebounds
count 8.000000 8.00000 8.000000
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
min 11.000000 4.00000 5.000000
25% 14,000000 6,50000 6,000000
50% 18.500000 8.00000 8.500000
75% 20.500000 9.00000 10.250000
max 28.000000 12.00000 12.000000
हालाँकि, हम प्रत्येक संख्यात्मक चर के माध्य और मानक विचलन की गणना करने के लिए निम्नलिखित वाक्यविन्यास का उपयोग कर सकते हैं:
#only calculate mean and standard deviation of each numeric variable
df. describe (). loc [[' mean ', ' std ']]
points assists rebounds
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
ध्यान दें कि आउटपुट में प्रत्येक संख्यात्मक चर के लिए केवल माध्य और मानक विचलन शामिल है।
ध्यान दें कि डिस्क्रिप्शन () फ़ंक्शन अभी भी पहले की तरह प्रत्येक वर्णनात्मक आंकड़ों की गणना करता है, लेकिन हमने आउटपुट में केवल माध्य और एसटीडी नामक पंक्तियों का चयन करने के लिए लोक फ़ंक्शन का उपयोग किया है।
संबंधित: पांडा लोक बनाम आईलोक: क्या अंतर है?
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:
पांडा: समूह द्वारा वर्णन() का उपयोग कैसे करें
पांडा: विशिष्ट प्रतिशतक के साथ वर्णन() का उपयोग कैसे करें
पांडा: वर्णन() का उपयोग कैसे करें और वैज्ञानिक संकेतन कैसे हटाएं