पांडा में डुप्लिकेट की गिनती कैसे करें: उदाहरण के साथ
आप पांडा डेटाफ़्रेम में डुप्लिकेट की गणना करने के लिए निम्नलिखित विधियों का उपयोग कर सकते हैं:
विधि 1: एक कॉलम में डुप्लिकेट मानों की गणना करें
len (df[' my_column ']) - len (df[' my_column ']. drop_duplicates ())
विधि 2: डुप्लिकेट पंक्तियों की गणना करें
len (df) -len ( df.drop_duplicates ())
विधि 3: प्रत्येक अद्वितीय पंक्ति के लिए डुप्लिकेट की गणना करें
df. groupby ( df.columns.tolist (), as_index= False ) . size ()
निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित पांडा डेटाफ़्रेम के साथ व्यवहार में प्रत्येक विधि का उपयोग कैसे करें:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' position ': ['G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'], ' points ': [5, 5, 8, 10, 5, 7, 10, 10]}) #view DataFrame print (df) team position points 0 AG 5 1 GA 5 2 AG 8 3 AF 10 4 BG 5 5 BG 7 6 BF 10 7 BF 10
उदाहरण 1: एक कॉलम में डुप्लिकेट मानों की गणना करें
निम्नलिखित कोड दिखाता है कि अंक कॉलम में डुप्लिकेट मानों की संख्या की गणना कैसे करें:
#count duplicate values in points column
len (df[' points '])- len (df[' points ']. drop_duplicates ())
4
हम देख सकते हैं कि पॉइंट कॉलम में 4 डुप्लिकेट मान हैं।
उदाहरण 2: डुप्लिकेट पंक्तियों की गणना करें
निम्नलिखित कोड दिखाता है कि डेटाफ़्रेम में डुप्लिकेट पंक्तियों की संख्या की गणना कैसे करें:
#count number of duplicate rows
len (df) -len ( df.drop_duplicates ())
2
हम देख सकते हैं कि डेटाफ़्रेम में 2 डुप्लिकेट पंक्तियाँ हैं।
हम इन 2 डुप्लिकेट पंक्तियों को प्रदर्शित करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
#display duplicated rows
df[df. duplicated ()]
team position points
1 A G 5
7 B F 10
उदाहरण 3: प्रत्येक अद्वितीय पंक्ति के लिए डुप्लिकेट की गणना करें
निम्नलिखित कोड दिखाता है कि डेटाफ़्रेम में प्रत्येक अद्वितीय पंक्ति के लिए डुप्लिकेट की संख्या की गणना कैसे करें:
#display number of duplicates for each unique row
df. groupby ( df.columns.tolist (), as_index= False ) . size ()
team position points size
0 A F 10 1
1 A G 5 2
2 A G 8 1
3 B F 10 2
4 B G 5 1
5 B G 7 1
आकार कॉलम प्रत्येक अद्वितीय पंक्ति के लिए डुप्लिकेट की संख्या प्रदर्शित करता है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:
पांडा में डुप्लिकेट पंक्तियाँ कैसे हटाएँ
पंडों में डुप्लिकेट कॉलम कैसे हटाएं
पंडों में इंडेक्स द्वारा कॉलम का चयन कैसे करें