पांडा: श्रेणीबद्ध चर के लिए वर्णन() का उपयोग कैसे करें
डिफ़ॉल्ट रूप से, पांडा में वर्णन() फ़ंक्शन डेटाफ़्रेम में सभी संख्यात्मक चर के लिए वर्णनात्मक आंकड़ों की गणना करता है।
हालाँकि, आप श्रेणीगत चरों के लिए वर्णनात्मक आँकड़ों की गणना करने के लिए निम्नलिखित विधियों का भी उपयोग कर सकते हैं:
विधि 1: श्रेणीबद्ध चर के लिए वर्णनात्मक सांख्यिकी की गणना करें
df. describe (include=' object ')
यह विधि डेटाफ़्रेम में प्रत्येक श्रेणीगत चर के लिए गिनती , अद्वितीय , शीर्ष और आवृत्ति की गणना करेगी।
विधि 2: सभी चरों के लिए श्रेणीबद्ध वर्णनात्मक आँकड़ों की गणना करें
df. astype (' object '). describe ()
यह विधि डेटाफ़्रेम में प्रत्येक चर के लिए गिनती , अद्वितीय , शीर्ष और आवृत्ति की गणना करेगी।
निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित पांडा डेटाफ़्रेम के साथ प्रत्येक विधि का उपयोग कैसे करें जिसमें विभिन्न बास्केटबॉल खिलाड़ियों के बारे में जानकारी शामिल है:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
' points ': [18, 22, 19, 14, 14, 11, 20, 28],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#view DataFrame
print (df)
team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12
उदाहरण 1: श्रेणीबद्ध चर के लिए वर्णनात्मक सांख्यिकी की गणना करें
हम डेटाफ़्रेम में प्रत्येक श्रेणीगत चर के लिए वर्णनात्मक आंकड़ों की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
#calculate descriptive statistics for categorical variables only
df. describe (include=' object ')
team
count 8
single 8
top A
freq 1
आउटपुट डेटाफ़्रेम में एकल श्रेणीगत चर ( टीम ) के लिए विभिन्न वर्णनात्मक आँकड़े प्रदर्शित करता है।
यहां परिणाम की व्याख्या करने का तरीका बताया गया है:
- गिनती : टीम कॉलम में 8 मान हैं।
- अद्वितीय : टीम कॉलम में 8 अद्वितीय मान हैं।
- शीर्ष : “शीर्ष” मान (अर्थात वर्णमाला में उच्चतम) ए है।
- आवृत्ति : यह अधिकतम मान 1 बार प्रकट होता है।
उदाहरण 2: सभी चरों के लिए श्रेणीबद्ध वर्णनात्मक आँकड़ों की गणना करें
हम डेटाफ़्रेम में प्रत्येक चर के लिए गिनती , अद्वितीय , शीर्ष और आवृत्ति की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
#calculate categorical descriptive statistics for all variables df. astype (' object '). describe () team points assists rebounds count 8 8 8 8 single 8 7 5 7 top A 14 9 6 freq 1 2 3 2
आउटपुट संख्यात्मक चर सहित डेटाफ़्रेम में प्रत्येक चर के लिए गिनती , अद्वितीय , शीर्ष और आवृत्ति प्रदर्शित करता है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:
पांडा: समूह द्वारा वर्णन() का उपयोग कैसे करें
पांडा: विशिष्ट प्रतिशतक के साथ वर्णन() का उपयोग कैसे करें
पांडा: वर्णन() का उपयोग कैसे करें और वैज्ञानिक संकेतन कैसे हटाएं