पांडा में वर्णन () फ़ंक्शन का उपयोग कैसे करें (उदाहरण के साथ)


आप पांडा डेटाफ़्रेम के लिए वर्णनात्मक आँकड़े उत्पन्न करने के लिए वर्णन() फ़ंक्शन का उपयोग कर सकते हैं।

यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:

 df. describe ()

निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित पांडा डेटाफ़्रेम के साथ व्यवहार में इस सिंटैक्स का उपयोग कैसे करें:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 C 23 9 5
6 C 25 9 9
7 C 29 4 12

उदाहरण 1: सभी संख्यात्मक स्तंभों का वर्णन करें

डिफ़ॉल्ट रूप से, वर्णन() फ़ंक्शन केवल पांडा डेटाफ़्रेम के संख्यात्मक कॉलम के लिए वर्णनात्मक आँकड़े उत्पन्न करता है:

 #generate descriptive statistics for all numeric columns
df. describe ()

	points assists rebounds
count 8.000000 8.00000 8.000000
mean 20.250000 7.75000 8.375000
std 6.158618 2.54951 2.559994
min 12.000000 4.00000 5.000000
25% 14.750000 6.50000 6.000000
50% 21.000000 8.00000 8.500000
75% 25,000000 9,00000 10,250000
max 29.000000 12.00000 12.000000

डेटाफ़्रेम के तीन संख्यात्मक स्तंभों के लिए वर्णनात्मक आँकड़े प्रदर्शित किए जाते हैं।

नोट: यदि किसी कॉलम में मान गायब हैं, तो वर्णनात्मक आंकड़ों की गणना करते समय पांडा स्वचालित रूप से इन मानों को बाहर कर देगा।

उदाहरण 2: सभी स्तंभों का वर्णन करें

डेटाफ़्रेम के प्रत्येक कॉलम के लिए वर्णनात्मक आँकड़ों की गणना करने के लिए, हम include=’all’ तर्क का उपयोग कर सकते हैं:

 #generate descriptive statistics for all columns
df. describe (include=' all ')

	team points assists rebounds
count 8 8.000000 8.00000 8.000000
single 3 NaN NaN NaN
top B NaN NaN NaN
freq 3 NaN NaN NaN
mean NaN 20.250000 7.75000 8.375000
std NaN 6.158618 2.54951 2.559994
min NaN 12.000000 4.00000 5.000000
25% NaN 14.750000 6.50000 6.000000
50% NaN 21.000000 8.00000 8.500000
75% NaN 25.000000 9.00000 10.250000
max NaN 29.000000 12.00000 12.000000

उदाहरण 3: विशिष्ट स्तंभों का वर्णन करें

निम्नलिखित कोड दिखाता है कि पांडा डेटाफ़्रेम के एक विशिष्ट कॉलम के लिए वर्णनात्मक आंकड़ों की गणना कैसे करें:

 #calculate descriptive statistics for 'points' column only
df[' points ']. describe ()

count 8.000000
mean 20.250000
std 6.158618
min 12.000000
25% 14.750000
50% 21,000000
75% 25,000000
max 29.000000
Name: points, dtype: float64

निम्नलिखित कोड दिखाता है कि कई विशिष्ट स्तंभों के लिए वर्णनात्मक आंकड़ों की गणना कैसे करें:

 #calculate descriptive statistics for 'points' and 'assists' columns only
df[[' points ', ' assists ']]. describe ()

	assist points
count 8.000000 8.00000
mean 20.250000 7.75000
std 6.158618 2.54951
min 12.000000 4.00000
25% 14.750000 6.50000
50% 21,000000 8,00000
75% 25.000000 9.00000
max 29.000000 12.00000

आप डिस्क्रिप्शन() फ़ंक्शन के लिए संपूर्ण दस्तावेज़ यहां पा सकते हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:

पांडा: किसी कॉलम में अद्वितीय मान कैसे खोजें
पांडा: दो रेखाओं के बीच अंतर कैसे पता करें
पांडा: डेटाफ़्रेम में लुप्त मानों की गणना कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *