पांडा: स्थिति के आधार पर बूलियन कॉलम कैसे बनाएं


आप पांडा डेटाफ़्रेम में स्थिति-आधारित बूलियन कॉलम बनाने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं:

 df[' boolean_column '] = np. where (df[' some_column '] > 15, True , False )

यह विशेष सिंटैक्स दो संभावित मानों के साथ एक नया बूलियन कॉलम बनाता है:

  • यदि some_column में मान 15 से अधिक है तो यह सत्य है
  • गलत है यदि some_column में मान 15 से कम या उसके बराबर है।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण: पांडा में स्थिति के आधार पर एक बूलियन कॉलम बनाएं

मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम है जिसमें विभिन्न बास्केटबॉल खिलाड़ियों के बारे में जानकारी है:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [5, 17, 7, 19, 12, 13, 9, 24]})

#view DataFrame
print (df)

  team points
0 to 5
1 to 17
2 to 7
3 to 19
4 B 12
5 B 13
6 B 9
7 B 24   

हम एक नया कॉलम बनाने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं जिसे गुड_प्लेयर कहा जाता है जो कि यदि पॉइंट कॉलम में मान 15 से अधिक है या अन्यथा गलत है तो यह सही लौटाता है:

 import numpy as np

#create new boolean column based on value in points column
df[' good_player '] = np. where (df[' points '] > 15, True , False )

#view updated DataFrame
print (df)

  team points good_player
0 To 5 False
1 To 17 True
2 To 7 False
3 To 19 True
4 B 12 False
5 B 13 False
6 B 9 False
7 B 24 True

ध्यान दें कि Good_player नामक नए कॉलम में केवल दो मान हैं: True या False

हम यह सत्यापित करने के लिए dtypes() फ़ंक्शन का उपयोग कर सकते हैं कि नया Good_player कॉलम वास्तव में एक बूलियन कॉलम है:

 #display data type of good_player column
df[' good_player ']. dtype

dtype('bool')

नया गुड_प्लेयर कॉलम वास्तव में एक बूलियन कॉलम है।

यह भी ध्यान दें कि यदि आप चाहें तो आप True और False के बजाय 1 और 0 जैसे संख्यात्मक मान लौटा सकते हैं:

 import numpy as np

#create new boolean column based on value in points column
df[' good_player '] = np. where (df[' points '] > 15, 1 , 0 )

#view updated DataFrame
print (df)

  team points good_player
0 to 5 0
1 To 17 1
2 to 7 0
3 A 19 1
4 B 12 0
5 B 13 0
6 B 9 0
7 B 24 1

यदि अंक कॉलम में संबंधित मान 15 से अधिक है, तो गुड_प्लेयर कॉलम में अब 1 शामिल है।

अन्यथा, इसमें मान 0 है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:

पांडा में अनेक स्थितियों के आधार पर पंक्तियों का चयन कैसे करें
पंडों में किसी शर्त के आधार पर एक नया कॉलम कैसे बनाएं
पांडा डेटाफ़्रेम को अनेक स्थितियों पर कैसे फ़िल्टर करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *