पांडा: कॉलम से विशेष वर्ण कैसे हटाएं
आप पांडा डेटाफ़्रेम में किसी कॉलम से विशेष वर्ण हटाने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं:
df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )
यह विशेष उदाहरण my_column से उन सभी वर्णों को हटा देगा जो न तो अक्षर हैं और न ही संख्याएँ।
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।
उदाहरण: पांडा में कॉलम से विशेष वर्ण हटाएं
मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम है जिसमें विभिन्न बास्केटबॉल खिलाड़ियों के बारे में जानकारी है:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'], ' points ': [12, 15, 22, 29, 24]}) #view DataFrame print (df) team points 0 Mavs$ 12 1 Nets 15 2 Kings!! 22 3 Spurs% 29 4 &Heat& 24
मान लीजिए कि हम टीम कॉलम मानों से सभी विशेष वर्ण हटाना चाहते हैं।
ऐसा करने के लिए हम निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
#remove special characters from team column df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True ) #view updated DataFrame print (df) team points 0 Mavs 12 1 Nets 15 2 Kings 22 3 Spurs 29 4 Heat 24
ध्यान दें कि टीम कॉलम मानों से सभी विशेष वर्ण हटा दिए गए हैं।
ध्यान दें : रेगुलर एक्सप्रेशन \W का उपयोग सभी गैर-शब्द वर्णों को खोजने के लिए किया जाता है, अर्थात वे वर्ण जो न तो वर्णमाला और न ही संख्यात्मक हैं।
इस उदाहरण में, हमने प्रत्येक गैर-शब्द वर्ण को एक खाली मान से बदल दिया है, जो गैर-शब्द वर्णों को हटाने के बराबर है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:
पांडा में NaN मानों को शून्य से कैसे बदलें
पंडों में खाली स्ट्रिंग्स को NaN से कैसे बदलें
पांडा में स्थिति के आधार पर कॉलम में मानों को कैसे बदलें