पांडा: सूचकांक के आधार पर समूह कैसे बनाएं और गणना कैसे करें


आप पांडा में एक या अधिक सूचकांक स्तंभों को समूहीकृत करने और गणना करने के लिए निम्नलिखित विधियों का उपयोग कर सकते हैं:

विधि 1: इंडेक्स कॉलम के आधार पर समूह बनाएं

 df. groupby (' index1 ')[' numeric_column ']. max ()

विधि 2: एकाधिक सूचकांक स्तंभों के आधार पर समूह बनाएं

 df. groupby ([' index1 ',' index2 '])[' numeric_column ']. sum ()

विधि 3: इंडेक्स कॉलम और रेगुलर कॉलम के आधार पर समूह बनाएं

 df. groupby ([' index1 ',' numeric_column1 '])[' numeric_column2 ']. nunique ()

निम्नलिखित उदाहरण दिखाते हैं कि मल्टीइंडेक्स वाले निम्नलिखित पांडा डेटाफ़्रेम के साथ प्रत्येक विधि का उपयोग कैसे करें:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'G', 'F', 'F', 'G', 'G', 'F', 'F', 'F'],
                   ' points ': [7, 7, 7, 19, 16, 9, 10, 10, 8, 8],
                   ' rebounds ': [8, 8, 8, 10, 11, 12, 13, 13, 15, 11]})

#set 'team' column to be index column
df. set_index ([' team ', ' position '], inplace= True )

#view DataFrame
df

		 rebound points
team position		
A G 7 8
        G 7 8
        G 7 8
        F 19 10
        F 16 11
B G 9 12
        G 10 13
        F 10 13
        F 8 15
        F 8 11

विधि 1: इंडेक्स कॉलम के आधार पर समूह बनाएं

निम्नलिखित कोड दिखाता है कि “स्थिति” सूचकांक कॉलम द्वारा समूहीकृत “अंक” कॉलम का अधिकतम मूल्य कैसे पाया जाए:

 #find max value of 'points' grouped by 'position index column
df. groupby (' position ')[' points ']. max ()

position
F 19
G 10
Name: points, dtype: int64

विधि 2: एकाधिक सूचकांक स्तंभों के आधार पर समूह बनाएं

निम्नलिखित कोड दिखाता है कि “टीम” और “स्थिति” सूचकांक कॉलम द्वारा समूहीकृत “अंक” कॉलम का योग कैसे पाया जाए:

 #find max value of 'points' grouped by 'position index column
df. groupby ([' team ', ' position '])[' points ']. sum ()

team position
AF35
      G21
BF 26
      G 19
Name: points, dtype: int64

विधि 3: इंडेक्स कॉलम और रेगुलर कॉलम के आधार पर समूह बनाएं

निम्नलिखित कोड दिखाता है कि “टीम” इंडेक्स कॉलम और नियमित “पॉइंट्स” कॉलम द्वारा समूहीकृत “रिबाउंड्स” कॉलम में अद्वितीय मानों की संख्या कैसे प्राप्त करें:

 #find max value of 'points' grouped by 'position index column
df. groupby ([' team ', ' points '])[' rebounds ']. nunique ()

team points
At 7 1
      16 1
      19 1
B 8 2
      9 1
      10 1
Name: rebounds, dtype: int64

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:

पांडा में अद्वितीय मानों की गणना कैसे करें
पंडों में मल्टीइंडेक्स को कैसे फ़्लैट करें
पांडा में एक या अधिक सूचकांक मानों को कैसे संशोधित करें
पंडों में एक इंडेक्स को कैसे रीसेट करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *