पांडा: पूरे कॉलम की सबस्ट्रिंग कैसे प्राप्त करें


पांडा डेटाफ़्रेम में संपूर्ण कॉलम की सबस्ट्रिंग प्राप्त करने के लिए आप निम्नलिखित मूल सिंटैक्स का उपयोग कर सकते हैं:

 df[' some_substring '] = df[' string_column ']. str [1:4]

यह विशेष उदाहरण some_substring नामक एक नया कॉलम बनाता है जिसमें string_column में स्थिति 1 से 4 तक के वर्ण शामिल होते हैं।

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण: पांडा में पूरे कॉलम की सबस्ट्रिंग प्राप्त करें

मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम है जिसमें विभिन्न बास्केटबॉल टीमों के बारे में जानकारी शामिल है:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavericks', 'Warriors', 'Rockets', 'Hornets', 'Lakers'],
                   ' points ': [120, 132, 108, 118, 106]})

#view DataFrame
print (df)

        team points
0 Mavericks 120
1 Warriors 132
2 Rockets 108
3 Hornets 118
4 Lakers 106

हम स्थिति 1 और 4 के बीच टीम कॉलम के वर्णों वाला एक नया कॉलम बनाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #create column that extracts characters in positions 1 through 4 in team column
df[' team_substring '] = df[' team ']. str [1:4]

#view updated DataFrame
print (df)

        team points team_substring
0 Mavericks 120 ave
1 Warriors 132 arr
2 Rockets 108 ock
3 Hornets 118 orn
4 Lakers 106 ake

Team_substring नामक नए कॉलम में स्थिति 1 और 4 के बीच टीम कॉलम के अक्षर शामिल हैं।

ध्यान दें कि यदि आप किसी संख्यात्मक कॉलम से सबस्ट्रिंग निकालने के लिए इस सिंटैक्स का उपयोग करने का प्रयास करते हैं, तो आपको एक त्रुटि प्राप्त होगी:

 #attempt to extract characters in positions 0 through 2 in points column
df[' points_substring '] = df[' points ']. str [:2]

AttributeError: Can only use .str accessor with string values!

इसके बजाय, आपको पहले astype(str) का उपयोग करके संख्यात्मक कॉलम को एक स्ट्रिंग में बदलना होगा:

 #extract characters in positions 0 through 2 in points column
df[' points_substring '] = df[' points ']. astype (str). str [:2]

#view updated DataFrame
print (df)

        team points points_substring
0 Mavericks 120 12
1 Warriors 132 13
2 Rockets 108 10
3 Hornets 118 11
4 Lakers 106 10

इस बार हम डॉट कॉलम से 0 से 2 तक के अक्षरों को सफलतापूर्वक निकालने में सक्षम हैं क्योंकि हमने पहले उन्हें एक स्ट्रिंग में परिवर्तित किया था।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य कार्य कैसे करें:

पांडा: जांचें कि क्या स्ट्रिंग में एकाधिक सबस्ट्रिंग हैं
पांडा: किसी कॉलम में प्रत्येक मान में एक स्ट्रिंग कैसे जोड़ें
पांडा: एक विशिष्ट स्ट्रिंग वाले कॉलम का चयन कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *