पांडा में "नॉट इन" फ़िल्टर का उपयोग कैसे करें (उदाहरण के साथ)
आप पांडा डेटाफ़्रेम में “NOT IN” फ़िल्टर निष्पादित करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
df[ ~ df[' col_name ']. isin (values_list)]
ध्यान दें कि Values_list में मान संख्यात्मक मान या वर्ण मान हो सकते हैं।
निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।
उदाहरण 1: एक कॉलम के साथ “नॉन इन” फ़िल्टर निष्पादित करें
निम्नलिखित कोड दिखाता है कि उन पंक्तियों के लिए पांडा डेटाफ़्रेम को कैसे फ़िल्टर किया जाए जहां नामों की सूची में टीम का नाम नहीं है:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #define list of teams we don't want values_list = [' A ', ' B '] #filter for rows where team name is not in list df[ ~ df[' team ']. isin (values_list)] team points assists rebounds 6 C 25 9 9 7 C 29 4 12
और निम्नलिखित कोड दिखाता है कि उन पंक्तियों के लिए पांडा डेटाफ़्रेम को कैसे फ़िल्टर किया जाए जहां “अंक” कॉलम में कुछ मान शामिल नहीं हैं:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #define list of values we don't want values_list = [12, 15, 25] #filter for rows where team name is not in list df[ ~ df[' team ']. isin (values_list)] team points assists rebounds 3 B 14 9 6 4 B 19 12 6 5 B 23 9 5 7 C 29 4 12
उदाहरण 2: कई कॉलमों के साथ “नॉन इन” फ़िल्टर निष्पादित करें
निम्नलिखित कोड दिखाता है कि उन पंक्तियों के लिए पांडा डेटाफ़्रेम को कैसे फ़िल्टर किया जाए जहां कुछ टीम के नाम कई कॉलमों में से एक में नहीं हैं:
import pandas as pd #createDataFrame df = pd. DataFrame ({' star_team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'], ' backup_team ': ['B', 'B', 'C', 'C', 'D', 'D', 'D', 'E'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #define list of teams we don't want values_list = [' C ', ' E '] #filter for rows where team name is not in one of several columns df[ ~ df[[' star_team ', ' backup_team ']]. isin (values_list). any (axis= 1 )] star_team backup_team points assists rebounds 0 A B 25 5 11 1 A B 12 7 8 4 B D 19 12 6 5 B D 23 9 5
ध्यान दें कि हमने हर उस पंक्ति को फ़िल्टर किया है जहाँ “C” या “E” टीमें “star_team” कॉलम में या “backup_team” कॉलम में दिखाई देती हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य फ़िल्टरिंग ऑपरेशन कैसे करें:
पंडों में “इज़ नॉट नल” का उपयोग कैसे करें
कॉलम मानों द्वारा पांडा डेटाफ़्रेम को कैसे फ़िल्टर करें
पांडा डेटाफ़्रेम पंक्तियों को तिथि के अनुसार कैसे फ़िल्टर करें
पांडा डेटाफ़्रेम को अनेक स्थितियों पर कैसे फ़िल्टर करें