पांडास डेटाफ़्रेम में एकल पंक्तियों का चयन कैसे करें
आप पांडा डेटाफ़्रेम में एकल पंक्तियों का चयन करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
df = df. drop_duplicates ()
और आप पांडा डेटाफ़्रेम में विशिष्ट कॉलम में एकल पंक्तियों का चयन करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])
निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित पांडा डेटाफ़्रेम के साथ व्यवहार में इस सिंटैक्स का उपयोग कैसे करें:
import pandas as pd #createDataFrame df = pd. DataFrame ({' a ':[4,4,3,8], ' b ': [2, 2, 6, 8], ' c ': [2, 2, 9, 9]}) #view DataFrame df a b c 0 4 2 2 1 4 2 2 2 3 6 9 3 8 8 9
उदाहरण 1: सभी स्तंभों में अद्वितीय पंक्तियों का चयन करें
निम्नलिखित कोड दिखाता है कि पांडा डेटाफ़्रेम के सभी स्तंभों में अद्वितीय पंक्तियों का चयन कैसे करें:
#drop duplicates from DataFrame df = df. drop_duplicates () #view DataFrame df a b c 0 4 2 2 2 3 6 9 3 8 8 9
पहली और दूसरी पंक्तियाँ डुप्लिकेट थीं, इसलिए पांडा ने दूसरी पंक्ति को हटा दिया।
डिफ़ॉल्ट रूप से, ड्रॉप_डुप्लिकेट्स() फ़ंक्शन पहला डुप्लिकेट रखेगा। हालाँकि, आप इसके बजाय अंतिम डुप्लिकेट रखने के लिए निर्दिष्ट कर सकते हैं:
#drop duplicates from DataFrame, keep last duplicate df = df. drop_duplicates (keep=' last ') #view DataFrame df a b c 1 4 2 2 2 3 6 9 3 8 8 9
उदाहरण 2: विशिष्ट स्तंभों में अद्वितीय पंक्तियों का चयन करें
निम्नलिखित कोड दिखाता है कि डेटाफ़्रेम के एकल “सी” कॉलम में एकल पंक्तियों का चयन कैसे करें:
#drop duplicates from column 'c' in DataFrame df = df. drop_duplicates (subset=[' c ']) #view DataFrame df a b c 0 4 2 2 2 3 6 9
डेटाफ़्रेम से दो पंक्तियाँ हटा दी गईं।
अतिरिक्त संसाधन
पांडास डेटाफ़्रेम में अनुक्रमणिका द्वारा पंक्तियों का चयन कैसे करें
पांडास डेटाफ़्रेम में पंक्ति संख्याएँ कैसे प्राप्त करें
पांडा में किसी कॉलम में अद्वितीय मान कैसे खोजें