पांडा में "नॉट इन" फ़िल्टर का उपयोग कैसे करें (उदाहरण के साथ)


आप पांडा डेटाफ़्रेम में “NOT IN” फ़िल्टर निष्पादित करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 df[ ~ df[' col_name ']. isin (values_list)]

ध्यान दें कि Values_list में मान संख्यात्मक मान या वर्ण मान हो सकते हैं।

निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण 1: एक कॉलम के साथ “नॉन इन” फ़िल्टर निष्पादित करें

निम्नलिखित कोड दिखाता है कि उन पंक्तियों के लिए पांडा डेटाफ़्रेम को कैसे फ़िल्टर किया जाए जहां नामों की सूची में टीम का नाम नहीं है:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#define list of teams we don't want
values_list = [' A ', ' B ']

#filter for rows where team name is not in list
df[ ~ df[' team ']. isin (values_list)]

        team points assists rebounds
6 C 25 9 9
7 C 29 4 12

और निम्नलिखित कोड दिखाता है कि उन पंक्तियों के लिए पांडा डेटाफ़्रेम को कैसे फ़िल्टर किया जाए जहां “अंक” कॉलम में कुछ मान शामिल नहीं हैं:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#define list of values we don't want
values_list = [12, 15, 25]

#filter for rows where team name is not in list
df[ ~ df[' team ']. isin (values_list)]

	team points assists rebounds
3 B 14 9 6
4 B 19 12 6
5 B 23 9 5
7 C 29 4 12

उदाहरण 2: कई कॉलमों के साथ “नॉन इन” फ़िल्टर निष्पादित करें

निम्नलिखित कोड दिखाता है कि उन पंक्तियों के लिए पांडा डेटाफ़्रेम को कैसे फ़िल्टर किया जाए जहां कुछ टीम के नाम कई कॉलमों में से एक में नहीं हैं:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' star_team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
                   ' backup_team ': ['B', 'B', 'C', 'C', 'D', 'D', 'D', 'E'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#define list of teams we don't want
values_list = [' C ', ' E ']

#filter for rows where team name is not in one of several columns
df[ ~ df[[' star_team ', ' backup_team ']]. isin (values_list). any (axis= 1 )] 

        star_team backup_team points assists rebounds
0 A B 25 5 11
1 A B 12 7 8
4 B D 19 12 6
5 B D 23 9 5

ध्यान दें कि हमने हर उस पंक्ति को फ़िल्टर किया है जहाँ “C” या “E” टीमें “star_team” कॉलम में या “backup_team” कॉलम में दिखाई देती हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य फ़िल्टरिंग ऑपरेशन कैसे करें:

पंडों में “इज़ नॉट नल” का उपयोग कैसे करें
कॉलम मानों द्वारा पांडा डेटाफ़्रेम को कैसे फ़िल्टर करें
पांडा डेटाफ़्रेम पंक्तियों को तिथि के अनुसार कैसे फ़िल्टर करें
पांडा डेटाफ़्रेम को अनेक स्थितियों पर कैसे फ़िल्टर करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *