पांडा: स्ट्रिंग्स से विशिष्ट वर्णों को कैसे हटाएं


आप पांडा डेटाफ़्रेम में किसी कॉलम में स्ट्रिंग्स से विशिष्ट वर्णों को हटाने के लिए निम्न विधियों का उपयोग कर सकते हैं:

विधि 1: स्ट्रिंग्स से विशिष्ट वर्ण हटाएँ

 df[' my_column '] = df[' my_column ']. str . replace (' this_string ', '')

विधि 2: स्ट्रिंग से सभी अक्षर हटाएँ

 df[' my_column '] = df[' my_column ']. str . replace (' \D ', '', regex= True )

विधि 3: स्ट्रिंग्स से सभी संख्याएँ हटाएँ

 df[' my_column '] = df[' my_column ']. str . replace (' \d+ ', '', regex= True )

निम्नलिखित उदाहरण दिखाते हैं कि निम्नलिखित पांडा डेटाफ़्रेम के साथ व्यवहार में प्रत्येक विधि का उपयोग कैसे करें:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs2', 'Nets44', 'Kings33', 'Cavs90', 'Heat576'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs2 12
1 Nets44 15
2 Kings33 22
3 Cavs90 29
4 Heat576 24

उदाहरण 1: स्ट्रिंग्स से विशिष्ट वर्ण हटाएँ

हम टीम कॉलम में प्रत्येक स्ट्रिंग से “avs” को हटाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #remove 'avs' from strings in team column
df[' team '] = df[' team ']. str . replace (' avs ', '')

#view updated DataFrame
print (df)

      team points
0 M2 12
1 Nets44 15
2 Kings33 22
3 C90 29
4 Heat576 24

ध्यान दें कि टीम कॉलम में “Mavs” और “Cavs” वाली पंक्तियों से “avs” हटा दिया गया है।

उदाहरण 2: स्ट्रिंग से सभी अक्षर हटाएँ

हम टीम कॉलम में प्रत्येक स्ट्रिंग से सभी अक्षर हटाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #remove letters from strings in team column
df[' team '] = df[' team ']. str . replace (' \D ', '', regex= True )

#view updated DataFrame
print (df)

  team points
0 2 12
1 44 15
2 33 22
3 90 29
4,576 24

ध्यान दें कि टीम कॉलम में प्रत्येक स्ट्रिंग से सभी अक्षर हटा दिए गए हैं।

केवल संख्यात्मक मान ही बचे हैं।

उदाहरण 3: स्ट्रिंग्स से सभी संख्याएँ हटाएँ

हम टीम कॉलम में प्रत्येक स्ट्रिंग से सभी नंबरों को हटाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #remove numbers from strings in team column
df[' team '] = df[' team ']. str . replace (' \d+ ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Cavs 29
4 Heat 24

ध्यान दें कि टीम कॉलम में प्रत्येक स्ट्रिंग से सभी नंबर हटा दिए गए हैं।

केवल अक्षर बचे हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:

पांडा में NaN मानों को शून्य से कैसे बदलें
पंडों में खाली स्ट्रिंग्स को NaN से कैसे बदलें
पांडा में स्थिति के आधार पर कॉलम में मानों को कैसे बदलें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *