पांडा में वर्णन () फ़ंक्शन का उपयोग कैसे करें (उदाहरण के साथ)
आप पांडा डेटाफ़्रेम के लिए वर्णनात्मक आँकड़े उत्पन्न करने के लिए वर्णन() फ़ंक्शन का उपयोग कर सकते हैं।
यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:
df. describe ()
निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित पांडा डेटाफ़्रेम के साथ व्यवहार में इस सिंटैक्स का उपयोग कैसे करें:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
' points ': [25, 12, 15, 14, 19, 23, 25, 29],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#view DataFrame
df
team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 C 23 9 5
6 C 25 9 9
7 C 29 4 12
उदाहरण 1: सभी संख्यात्मक स्तंभों का वर्णन करें
डिफ़ॉल्ट रूप से, वर्णन() फ़ंक्शन केवल पांडा डेटाफ़्रेम के संख्यात्मक कॉलम के लिए वर्णनात्मक आँकड़े उत्पन्न करता है:
#generate descriptive statistics for all numeric columns df. describe () points assists rebounds count 8.000000 8.00000 8.000000 mean 20.250000 7.75000 8.375000 std 6.158618 2.54951 2.559994 min 12.000000 4.00000 5.000000 25% 14.750000 6.50000 6.000000 50% 21.000000 8.00000 8.500000 75% 25,000000 9,00000 10,250000 max 29.000000 12.00000 12.000000
डेटाफ़्रेम के तीन संख्यात्मक स्तंभों के लिए वर्णनात्मक आँकड़े प्रदर्शित किए जाते हैं।
नोट: यदि किसी कॉलम में मान गायब हैं, तो वर्णनात्मक आंकड़ों की गणना करते समय पांडा स्वचालित रूप से इन मानों को बाहर कर देगा।
उदाहरण 2: सभी स्तंभों का वर्णन करें
डेटाफ़्रेम के प्रत्येक कॉलम के लिए वर्णनात्मक आँकड़ों की गणना करने के लिए, हम include=’all’ तर्क का उपयोग कर सकते हैं:
#generate descriptive statistics for all columns
df. describe (include=' all ')
team points assists rebounds
count 8 8.000000 8.00000 8.000000
single 3 NaN NaN NaN
top B NaN NaN NaN
freq 3 NaN NaN NaN
mean NaN 20.250000 7.75000 8.375000
std NaN 6.158618 2.54951 2.559994
min NaN 12.000000 4.00000 5.000000
25% NaN 14.750000 6.50000 6.000000
50% NaN 21.000000 8.00000 8.500000
75% NaN 25.000000 9.00000 10.250000
max NaN 29.000000 12.00000 12.000000
उदाहरण 3: विशिष्ट स्तंभों का वर्णन करें
निम्नलिखित कोड दिखाता है कि पांडा डेटाफ़्रेम के एक विशिष्ट कॉलम के लिए वर्णनात्मक आंकड़ों की गणना कैसे करें:
#calculate descriptive statistics for 'points' column only
df[' points ']. describe ()
count 8.000000
mean 20.250000
std 6.158618
min 12.000000
25% 14.750000
50% 21,000000
75% 25,000000
max 29.000000
Name: points, dtype: float64
निम्नलिखित कोड दिखाता है कि कई विशिष्ट स्तंभों के लिए वर्णनात्मक आंकड़ों की गणना कैसे करें:
#calculate descriptive statistics for 'points' and 'assists' columns only
df[[' points ', ' assists ']]. describe ()
assist points
count 8.000000 8.00000
mean 20.250000 7.75000
std 6.158618 2.54951
min 12.000000 4.00000
25% 14.750000 6.50000
50% 21,000000 8,00000
75% 25.000000 9.00000
max 29.000000 12.00000
आप डिस्क्रिप्शन() फ़ंक्शन के लिए संपूर्ण दस्तावेज़ यहां पा सकते हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:
पांडा: किसी कॉलम में अद्वितीय मान कैसे खोजें
पांडा: दो रेखाओं के बीच अंतर कैसे पता करें
पांडा: डेटाफ़्रेम में लुप्त मानों की गणना कैसे करें