पांडा: कॉलम से विशेष वर्ण कैसे हटाएं


आप पांडा डेटाफ़्रेम में किसी कॉलम से विशेष वर्ण हटाने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं:

 df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )

यह विशेष उदाहरण my_column से उन सभी वर्णों को हटा देगा जो न तो अक्षर हैं और न ही संख्याएँ।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण: पांडा में कॉलम से विशेष वर्ण हटाएं

मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम है जिसमें विभिन्न बास्केटबॉल खिलाड़ियों के बारे में जानकारी है:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs$ 12
1 Nets 15
2 Kings!! 22
3 Spurs% 29
4 &Heat& 24

मान लीजिए कि हम टीम कॉलम मानों से सभी विशेष वर्ण हटाना चाहते हैं।

ऐसा करने के लिए हम निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #remove special characters from team column
df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Spurs 29
4 Heat 24

ध्यान दें कि टीम कॉलम मानों से सभी विशेष वर्ण हटा दिए गए हैं।

ध्यान दें : रेगुलर एक्सप्रेशन \W का उपयोग सभी गैर-शब्द वर्णों को खोजने के लिए किया जाता है, अर्थात वे वर्ण जो न तो वर्णमाला और न ही संख्यात्मक हैं।

इस उदाहरण में, हमने प्रत्येक गैर-शब्द वर्ण को एक खाली मान से बदल दिया है, जो गैर-शब्द वर्णों को हटाने के बराबर है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:

पांडा में NaN मानों को शून्य से कैसे बदलें
पंडों में खाली स्ट्रिंग्स को NaN से कैसे बदलें
पांडा में स्थिति के आधार पर कॉलम में मानों को कैसे बदलें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *