पांडा: एकाधिक कॉलम पर डुप्लिकेट कैसे हटाएं
आप पांडा डेटाफ़्रेम में एकाधिक स्तंभों में डुप्लिकेट पंक्तियों को हटाने के लिए निम्नलिखित विधियों का उपयोग कर सकते हैं:
विधि 1: सभी स्तंभों से डुप्लिकेट हटाएँ
df. drop_duplicates ()
विधि 2: विशिष्ट कॉलमों में डुप्लिकेट हटाएँ
df. drop_duplicates ([' column1 ',' column3 '])
निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित पांडा डेटाफ़्रेम के साथ व्यवहार में प्रत्येक विधि का उपयोग कैसे करें:
import pandas as pd #createDataFrame df = pd. DataFrame ({' region ': ['East', 'East', 'East', 'West', 'West', 'West'], ' store ': [1, 1, 2, 1, 2, 2], ' sales ': [5, 5, 7, 9, 12, 8]}) #view DataFrame print (df) region store sales 0 East 1 5 1 East 1 5 2 East 2 7 3 West 1 9 4 West 2 12 5 West 2 8
उदाहरण 1: सभी कॉलमों से डुप्लिकेट हटाएँ
निम्नलिखित कोड दिखाता है कि सभी कॉलमों में डुप्लिकेट मान वाली पंक्तियों को कैसे हटाया जाए:
#drop rows that have duplicate values across all columns
df. drop_duplicates ()
region store sales
0 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
5 West 2 8
सूचकांक स्थिति 1 पर पंक्ति के सभी स्तंभों में सूचकांक स्थिति 0 पर पंक्ति के समान मान थे, इसलिए इसे डेटाफ़्रेम से हटा दिया गया था।
डिफ़ॉल्ट रूप से, पांडा पहली पंक्ति को डुप्लिकेट के रूप में रखता है। हालाँकि, आप अंतिम डुप्लिकेट लाइन को बनाए रखने के लिए निर्दिष्ट करने के लिए कीप तर्क का उपयोग कर सकते हैं:
#drop rows that have duplicate values across all columns (keep last duplicate)
df. drop_duplicates (keep=' last ')
region store sales
1 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
5 West 2 8
उदाहरण 2: विशिष्ट कॉलमों में डुप्लिकेट हटाएँ
आप केवल क्षेत्र और स्टोर कॉलम में डुप्लिकेट मान वाली पंक्तियों को हटाने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं:
#drop rows that have duplicate values across region and store columns
df. drop_duplicates ([' region ',' store '])
region store sales
0 East 1 5
2 East 2 7
3 West 1 9
4 West 2 12
कुल मिलाकर, डेटाफ़्रेम से दो पंक्तियाँ हटा दी गईं क्योंकि उनमें क्षेत्र और स्टोर कॉलम में डुप्लिकेट मान थे।
नोट : आप यहां ड्रॉप_डुप्लिकेट्स() फ़ंक्शन के लिए पूर्ण दस्तावेज़ पा सकते हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:
पांडा में डुप्लिकेट कैसे खोजें
पंडों में डुप्लिकेट कॉलम कैसे हटाएं
पंडों के डेटाफ़्रेम में पहली पंक्ति को कैसे हटाएं