पांडा: विशिष्ट स्तंभों के साथ ड्रॉपना() का उपयोग कैसे करें


आप पांडा डेटाफ़्रेम से उन पंक्तियों को हटाने के लिए सबसेट तर्क के साथ ड्रॉपना() फ़ंक्शन का उपयोग कर सकते हैं जिनमें विशिष्ट कॉलम में गुम मान शामिल हैं।

व्यवहार में इस सुविधा का उपयोग करने के सबसे सामान्य तरीके यहां दिए गए हैं:

विधि 1: किसी विशिष्ट कॉलम में लुप्त मान वाली पंक्तियाँ हटाएँ

 df. dropna (subset = [' column1 '], inplace= True )

विधि 2: कई विशिष्ट स्तंभों में से किसी एक में लुप्त मान वाली पंक्तियाँ हटाएँ

 df. dropna (subset = [' column1 ', ' column2 ', ' column3 '], inplace= True )

निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित पांडा डेटाफ़्रेम के साथ व्यवहार में प्रत्येक विधि का उपयोग कैसे करें:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, np.nan, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, np.nan, np.nan, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, np.nan]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
1 B NaN NaN 8.0
2 C 19.0 NaN 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 9.0
7H 28.0 4.0 NaN

उदाहरण 1: किसी विशिष्ट कॉलम में लुप्त मान वाली पंक्तियाँ हटाएँ

हम “सहायता” कॉलम में गुम मान वाली पंक्तियों को हटाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #drop rows with missing values in 'assists' column
df. dropna (subset = [' assists '], inplace= True )

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 9.0
7H 28.0 4.0 NaN

ध्यान दें कि “सहायता” कॉलम में गुम मान वाली दो पंक्तियाँ डेटाफ़्रेम से हटा दी गई हैं।

यह भी ध्यान दें कि डेटाफ़्रेम की अंतिम पंक्ति को बरकरार रखा जाता है, भले ही उसमें कोई मान न हो क्योंकि गुम मान “मदद” कॉलम में नहीं है।

उदाहरण 2: कई विशिष्ट स्तंभों में से किसी एक में लुप्त मान वाली पंक्तियाँ हटाएँ

हम “प्वाइंट” या “बाउंस” कॉलम में गायब मान वाली पंक्तियों को हटाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #drop rows with missing values in 'points' or 'rebounds' column
df. dropna (subset = [' points ', ' rebounds '], inplace= True )

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
2 C 19.0 NaN 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 9.0

ध्यान दें कि “पॉइंट” या “बाउंस” कॉलम में गायब मान वाली दो पंक्तियों को डेटाफ़्रेम से हटा दिया गया है।

नोट : आप पांडा ड्रॉपना() फ़ंक्शन के लिए संपूर्ण दस्तावेज़ यहां पा सकते हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:

पांडा: ड्रॉपना () का उपयोग करने के बाद इंडेक्स को कैसे रीसेट करें
पांडा: NaN मान वाले कॉलम कैसे हटाएं
पांडा: अनेक स्थितियों के आधार पर पंक्तियाँ कैसे हटाएँ

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *