पांडा: दो स्तंभों को कैसे समूहित करें और एकत्रित करें


आप पांडा में ग्रुपबी() फ़ंक्शन के साथ निम्नलिखित मूल वाक्यविन्यास का उपयोग दो कॉलमों द्वारा समूहित करने और दूसरे कॉलम को एकत्रित करने के लिए कर सकते हैं:

 df. groupby ([' var1 ',' var2 '])[' var3 ']. mean ()

यह विशेष उदाहरण डेटाफ़्रेम को कॉलम var1 और var2 के आधार पर समूहित करता है, फिर कॉलम var3 के औसत की गणना करता है।

निम्नलिखित उदाहरण दिखाते हैं कि दो स्तंभों पर समूह कैसे बनाया जाए और निम्नलिखित पांडा डेटाफ़्रेम का उपयोग करके कैसे एकत्रित किया जाए:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'F', 'F', 'F', 'G', 'G', 'G', 'G', 'F'],
                   ' points ': [15, 22, 24, 25, 20, 35, 34, 19, 14, 12]})

#view DataFrame
print (df)

  team position points
0 AG 15
1 AG 22
2 AF 24
3 AF 25
4 AF 20
5 BG 35
6 BG 34
7 BG 19
8 BG 14
9 BF 12

उदाहरण 1: दो स्तंभों का समूह बनाएं और दूसरे स्तंभ का औसत परिकलित करें

हम टीम और स्थिति कॉलम द्वारा समूहीकृत अंक कॉलम के औसत मूल्य की गणना करने के लिए निम्नलिखित वाक्यविन्यास का उपयोग कर सकते हैं:

 #calculate mean of points grouped by team and position columns
df. groupby ([' team ', ' position '])[' points ']. mean ()

team position
AF23.0
      G 18.5
BF 12.0
      G 25.5
Name: points, dtype: float64

परिणाम से हम देख सकते हैं:

  • स्थिति F में टीम A के खिलाड़ियों का औसत अंक मान 23 है।
  • स्थिति G में टीम A के खिलाड़ियों का औसत अंक मान 18.5 है।

और इसी तरह।

उदाहरण 2: दो स्तंभों को समूहित करें और दूसरे स्तंभ की अधिकतम की गणना करें

हम टीम और स्थिति कॉलम द्वारा समूहीकृत अंक कॉलम के अधिकतम मूल्य की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #calculate max of points grouped by team and position columns
df. groupby ([' team ', ' position '])[' points ']. max ()

team position
AF25
      G22
BF 12
      G 35
Name: points, dtype: int64

परिणाम से हम देख सकते हैं:

  • टीम ए में स्थिति एफ पर खिलाड़ियों के लिए अधिकतम अंक मान 25 है।
  • स्थिति G में टीम A के खिलाड़ियों के लिए अधिकतम अंक मान 22 है।

और इसी तरह।

उदाहरण 3: दो स्तंभों के आधार पर समूह बनाएं और घटनाओं की गणना करें

हम टीम और स्थिति कॉलम के प्रत्येक संयोजन की घटनाओं की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #count occurrences of each combination of team and position columns
df. groupby ([' team ', ' position ']). size ()

team position
AF3
      G2
BF 1
      G4
dtype: int64

परिणाम से हम देख सकते हैं:

  • टीम A में स्थान F पर 3 खिलाड़ी हैं।
  • टीम A में स्थान G पर 2 खिलाड़ी हैं।

और इसी तरह।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:

Pandas GroupBy का उपयोग करके अद्वितीय मानों की गणना कैसे करें
पांडास ग्रुपबी में फ़ंक्शन कैसे लागू करें
पांडास ग्रुपबाय से बार प्लॉट कैसे बनाएं

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *