पांडा: बूलियन श्रृंखला का उपयोग करके डेटाफ़्रेम से पंक्तियों का चयन करें


आप बूलियन श्रृंखला के मूल्यों के आधार पर पांडा डेटाफ़्रेम में पंक्तियों का चयन करने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं:

 #define boolean series
bools = pd. Series ([ True , False , True , True , False , False , False , True ])

#select rows in DataFrame based on values in boolean series
df[bools. values ]

यह आपको पांडा डेटाफ़्रेम में प्रत्येक पंक्ति का चयन करने की अनुमति देता है जहां बूलियन श्रृंखला में संबंधित मान True है।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण: बूलियन श्रृंखला का उपयोग करके पांडा डेटाफ़्रेम में पंक्तियों का चयन करें

मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम है जिसमें विभिन्न बास्केटबॉल खिलाड़ियों के बारे में जानकारी है:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

हम डेटाफ़्रेम में सभी पंक्तियों का चयन करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं जहां बूलियन श्रृंखला में संबंधित मान सत्य है:

 #define boolean series
bools = pd. Series ([ True , False , True , True , False , False , False , True ])

#select rows in DataFrame based on values in boolean series
df[bools. values ]

     team points assists rebounds
0 A 18 5 11
2 C 19 7 10
3 D 14 9 6
7:28 4 12

ध्यान दें कि लौटाई गई एकमात्र पंक्तियाँ वे हैं जिनके लिए बूलियन श्रृंखला में संबंधित मान True है।

यह भी ध्यान दें कि आप डेटाफ़्रेम के “अंक” कॉलम में केवल पंक्तियों का चयन करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं जहां बूलियन श्रृंखला में संबंधित मान True है।

 #define boolean series
bools = pd. Series ([ True , False , True , True , False , False , False , True ])

#select rows in points column based on values in boolean series
df[' points '][bools. values ]

0 18
2 19
3 14
7 28
Name: points, dtype: int64

ध्यान दें कि “अंक” कॉलम द्वारा लौटाई गई एकमात्र पंक्तियाँ वे हैं जहाँ बूलियन श्रृंखला में संबंधित मान True है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:

पांडा में स्ट्रिंग की लंबाई के आधार पर पंक्तियों को कैसे फ़िल्टर करें
पांडा में NaN मान के बिना पंक्तियों का चयन कैसे करें
पांडा में कॉलम मानों के आधार पर पंक्तियों का चयन कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *