पांडा में डुप्लिकेट की गिनती कैसे करें: उदाहरण के साथ


आप पांडा डेटाफ़्रेम में डुप्लिकेट की गणना करने के लिए निम्नलिखित विधियों का उपयोग कर सकते हैं:

विधि 1: एक कॉलम में डुप्लिकेट मानों की गणना करें

 len (df[' my_column ']) - len (df[' my_column ']. drop_duplicates ())

विधि 2: डुप्लिकेट पंक्तियों की गणना करें

 len (df) -len ( df.drop_duplicates ())

विधि 3: प्रत्येक अद्वितीय पंक्ति के लिए डुप्लिकेट की गणना करें

 df. groupby ( df.columns.tolist (), as_index= False ) . size ()

निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित पांडा डेटाफ़्रेम के साथ व्यवहार में प्रत्येक विधि का उपयोग कैसे करें:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' position ': ['G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'],
                   ' points ': [5, 5, 8, 10, 5, 7, 10, 10]})

#view DataFrame
print (df)

  team position points
0 AG 5
1 GA 5
2 AG 8
3 AF 10
4 BG 5
5 BG 7
6 BF 10
7 BF 10

उदाहरण 1: एक कॉलम में डुप्लिकेट मानों की गणना करें

निम्नलिखित कोड दिखाता है कि अंक कॉलम में डुप्लिकेट मानों की संख्या की गणना कैसे करें:

 #count duplicate values in points column
len (df[' points '])- len (df[' points ']. drop_duplicates ())

4

हम देख सकते हैं कि पॉइंट कॉलम में 4 डुप्लिकेट मान हैं।

उदाहरण 2: डुप्लिकेट पंक्तियों की गणना करें

निम्नलिखित कोड दिखाता है कि डेटाफ़्रेम में डुप्लिकेट पंक्तियों की संख्या की गणना कैसे करें:

 #count number of duplicate rows
len (df) -len ( df.drop_duplicates ())

2

हम देख सकते हैं कि डेटाफ़्रेम में 2 डुप्लिकेट पंक्तियाँ हैं।

हम इन 2 डुप्लिकेट पंक्तियों को प्रदर्शित करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #display duplicated rows
df[df. duplicated ()]

        team position points
1 A G 5
7 B F 10

उदाहरण 3: प्रत्येक अद्वितीय पंक्ति के लिए डुप्लिकेट की गणना करें

निम्नलिखित कोड दिखाता है कि डेटाफ़्रेम में प्रत्येक अद्वितीय पंक्ति के लिए डुप्लिकेट की संख्या की गणना कैसे करें:

 #display number of duplicates for each unique row
df. groupby ( df.columns.tolist (), as_index= False ) . size ()

        team position points size
0 A F 10 1
1 A G 5 2
2 A G 8 1
3 B F 10 2
4 B G 5 1
5 B G 7 1

आकार कॉलम प्रत्येक अद्वितीय पंक्ति के लिए डुप्लिकेट की संख्या प्रदर्शित करता है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:

पांडा में डुप्लिकेट पंक्तियाँ कैसे हटाएँ
पंडों में डुप्लिकेट कॉलम कैसे हटाएं
पंडों में इंडेक्स द्वारा कॉलम का चयन कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *