पांडा: दो स्तंभों को कैसे समूहित करें और एकत्रित करें
आप पांडा में ग्रुपबी() फ़ंक्शन के साथ निम्नलिखित मूल वाक्यविन्यास का उपयोग दो कॉलमों द्वारा समूहित करने और दूसरे कॉलम को एकत्रित करने के लिए कर सकते हैं:
df. groupby ([' var1 ',' var2 '])[' var3 ']. mean ()
यह विशेष उदाहरण डेटाफ़्रेम को कॉलम var1 और var2 के आधार पर समूहित करता है, फिर कॉलम var3 के औसत की गणना करता है।
निम्नलिखित उदाहरण दिखाते हैं कि दो स्तंभों पर समूह कैसे बनाया जाए और निम्नलिखित पांडा डेटाफ़्रेम का उपयोग करके कैसे एकत्रित किया जाए:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'F', 'F', 'F', 'G', 'G', 'G', 'G', 'F'], ' points ': [15, 22, 24, 25, 20, 35, 34, 19, 14, 12]}) #view DataFrame print (df) team position points 0 AG 15 1 AG 22 2 AF 24 3 AF 25 4 AF 20 5 BG 35 6 BG 34 7 BG 19 8 BG 14 9 BF 12
उदाहरण 1: दो स्तंभों का समूह बनाएं और दूसरे स्तंभ का औसत परिकलित करें
हम टीम और स्थिति कॉलम द्वारा समूहीकृत अंक कॉलम के औसत मूल्य की गणना करने के लिए निम्नलिखित वाक्यविन्यास का उपयोग कर सकते हैं:
#calculate mean of points grouped by team and position columns
df. groupby ([' team ', ' position '])[' points ']. mean ()
team position
AF23.0
G 18.5
BF 12.0
G 25.5
Name: points, dtype: float64
परिणाम से हम देख सकते हैं:
- स्थिति F में टीम A के खिलाड़ियों का औसत अंक मान 23 है।
- स्थिति G में टीम A के खिलाड़ियों का औसत अंक मान 18.5 है।
और इसी तरह।
उदाहरण 2: दो स्तंभों को समूहित करें और दूसरे स्तंभ की अधिकतम की गणना करें
हम टीम और स्थिति कॉलम द्वारा समूहीकृत अंक कॉलम के अधिकतम मूल्य की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
#calculate max of points grouped by team and position columns
df. groupby ([' team ', ' position '])[' points ']. max ()
team position
AF25
G22
BF 12
G 35
Name: points, dtype: int64
परिणाम से हम देख सकते हैं:
- टीम ए में स्थिति एफ पर खिलाड़ियों के लिए अधिकतम अंक मान 25 है।
- स्थिति G में टीम A के खिलाड़ियों के लिए अधिकतम अंक मान 22 है।
और इसी तरह।
उदाहरण 3: दो स्तंभों के आधार पर समूह बनाएं और घटनाओं की गणना करें
हम टीम और स्थिति कॉलम के प्रत्येक संयोजन की घटनाओं की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
#count occurrences of each combination of team and position columns
df. groupby ([' team ', ' position ']). size ()
team position
AF3
G2
BF 1
G4
dtype: int64
परिणाम से हम देख सकते हैं:
- टीम A में स्थान F पर 3 खिलाड़ी हैं।
- टीम A में स्थान G पर 2 खिलाड़ी हैं।
और इसी तरह।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:
Pandas GroupBy का उपयोग करके अद्वितीय मानों की गणना कैसे करें
पांडास ग्रुपबी में फ़ंक्शन कैसे लागू करें
पांडास ग्रुपबाय से बार प्लॉट कैसे बनाएं