पांडा: सूचकांक के आधार पर समूह कैसे बनाएं और गणना कैसे करें
आप पांडा में एक या अधिक सूचकांक स्तंभों को समूहीकृत करने और गणना करने के लिए निम्नलिखित विधियों का उपयोग कर सकते हैं:
विधि 1: इंडेक्स कॉलम के आधार पर समूह बनाएं
df. groupby (' index1 ')[' numeric_column ']. max ()
विधि 2: एकाधिक सूचकांक स्तंभों के आधार पर समूह बनाएं
df. groupby ([' index1 ',' index2 '])[' numeric_column ']. sum ()
विधि 3: इंडेक्स कॉलम और रेगुलर कॉलम के आधार पर समूह बनाएं
df. groupby ([' index1 ',' numeric_column1 '])[' numeric_column2 ']. nunique ()
निम्नलिखित उदाहरण दिखाते हैं कि मल्टीइंडेक्स वाले निम्नलिखित पांडा डेटाफ़्रेम के साथ प्रत्येक विधि का उपयोग कैसे करें:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
' position ': ['G', 'G', 'G', 'F', 'F', 'G', 'G', 'F', 'F', 'F'],
' points ': [7, 7, 7, 19, 16, 9, 10, 10, 8, 8],
' rebounds ': [8, 8, 8, 10, 11, 12, 13, 13, 15, 11]})
#set 'team' column to be index column
df. set_index ([' team ', ' position '], inplace= True )
#view DataFrame
df
rebound points
team position
A G 7 8
G 7 8
G 7 8
F 19 10
F 16 11
B G 9 12
G 10 13
F 10 13
F 8 15
F 8 11
विधि 1: इंडेक्स कॉलम के आधार पर समूह बनाएं
निम्नलिखित कोड दिखाता है कि “स्थिति” सूचकांक कॉलम द्वारा समूहीकृत “अंक” कॉलम का अधिकतम मूल्य कैसे पाया जाए:
#find max value of 'points' grouped by 'position index column
df. groupby (' position ')[' points ']. max ()
position
F 19
G 10
Name: points, dtype: int64
विधि 2: एकाधिक सूचकांक स्तंभों के आधार पर समूह बनाएं
निम्नलिखित कोड दिखाता है कि “टीम” और “स्थिति” सूचकांक कॉलम द्वारा समूहीकृत “अंक” कॉलम का योग कैसे पाया जाए:
#find max value of 'points' grouped by 'position index column
df. groupby ([' team ', ' position '])[' points ']. sum ()
team position
AF35
G21
BF 26
G 19
Name: points, dtype: int64
विधि 3: इंडेक्स कॉलम और रेगुलर कॉलम के आधार पर समूह बनाएं
निम्नलिखित कोड दिखाता है कि “टीम” इंडेक्स कॉलम और नियमित “पॉइंट्स” कॉलम द्वारा समूहीकृत “रिबाउंड्स” कॉलम में अद्वितीय मानों की संख्या कैसे प्राप्त करें:
#find max value of 'points' grouped by 'position index column
df. groupby ([' team ', ' points '])[' rebounds ']. nunique ()
team points
At 7 1
16 1
19 1
B 8 2
9 1
10 1
Name: rebounds, dtype: int64
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:
पांडा में अद्वितीय मानों की गणना कैसे करें
पंडों में मल्टीइंडेक्स को कैसे फ़्लैट करें
पांडा में एक या अधिक सूचकांक मानों को कैसे संशोधित करें
पंडों में एक इंडेक्स को कैसे रीसेट करें