पांडास डेटाफ़्रेम में एकल पंक्तियों का चयन कैसे करें


आप पांडा डेटाफ़्रेम में एकल पंक्तियों का चयन करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 df = df. drop_duplicates ()

और आप पांडा डेटाफ़्रेम में विशिष्ट कॉलम में एकल पंक्तियों का चयन करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])

निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित पांडा डेटाफ़्रेम के साथ व्यवहार में इस सिंटैक्स का उपयोग कैसे करें:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' a ':[4,4,3,8],
                   ' b ': [2, 2, 6, 8],
                   ' c ': [2, 2, 9, 9]})

#view DataFrame
df

	a b c
0 4 2 2
1 4 2 2
2 3 6 9
3 8 8 9

उदाहरण 1: सभी स्तंभों में अद्वितीय पंक्तियों का चयन करें

निम्नलिखित कोड दिखाता है कि पांडा डेटाफ़्रेम के सभी स्तंभों में अद्वितीय पंक्तियों का चयन कैसे करें:

 #drop duplicates from DataFrame
df = df. drop_duplicates ()

#view DataFrame
df

	a b c
0 4 2 2
2 3 6 9
3 8 8 9

पहली और दूसरी पंक्तियाँ डुप्लिकेट थीं, इसलिए पांडा ने दूसरी पंक्ति को हटा दिया।

डिफ़ॉल्ट रूप से, ड्रॉप_डुप्लिकेट्स() फ़ंक्शन पहला डुप्लिकेट रखेगा। हालाँकि, आप इसके बजाय अंतिम डुप्लिकेट रखने के लिए निर्दिष्ट कर सकते हैं:

 #drop duplicates from DataFrame, keep last duplicate
df = df. drop_duplicates (keep=' last ')

#view DataFrame
df

	a b c
1 4 2 2
2 3 6 9
3 8 8 9

उदाहरण 2: विशिष्ट स्तंभों में अद्वितीय पंक्तियों का चयन करें

निम्नलिखित कोड दिखाता है कि डेटाफ़्रेम के एकल “सी” कॉलम में एकल पंक्तियों का चयन कैसे करें:

 #drop duplicates from column 'c' in DataFrame
df = df. drop_duplicates (subset=[' c '])

#view DataFrame
df
	a b c
0 4 2 2
2 3 6 9

डेटाफ़्रेम से दो पंक्तियाँ हटा दी गईं।

अतिरिक्त संसाधन

पांडास डेटाफ़्रेम में अनुक्रमणिका द्वारा पंक्तियों का चयन कैसे करें
पांडास डेटाफ़्रेम में पंक्ति संख्याएँ कैसे प्राप्त करें
पांडा में किसी कॉलम में अद्वितीय मान कैसे खोजें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *