पांडा: स्ट्रिंग्स को संख्याओं के रूप में एन्कोड करने के लिए फ़ैक्टराइज़ () का उपयोग कैसे करें


पांडा फ़ैक्टराइज़() फ़ंक्शन का उपयोग स्ट्रिंग्स को संख्यात्मक मानों के रूप में एन्कोड करने के लिए किया जा सकता है।

पांडा डेटाफ़्रेम के कॉलम में फ़ैक्टराइज़() फ़ंक्शन को लागू करने के लिए आप निम्नलिखित विधियों का उपयोग कर सकते हैं:

विधि 1: एक स्तंभ का गुणनखंड करें

 df[' col1 '] = pd. factorize (df[' col '])[0]

विधि 2: गुणनखंड विशिष्ट कॉलम

 df[[' col1 ', ' col3 ']] = df[[' col1 ', ' col3 ']]. apply ( lambda x: pd.factorize (x)[ 0 ])

विधि 3: सभी स्तंभों का गुणनखंड करें

 df = df. apply ( lambda x: pd.factorize (x)[ 0 ])

निम्नलिखित उदाहरण दिखाता है कि निम्नलिखित पांडा डेटाफ़्रेम के साथ प्रत्येक विधि का उपयोग कैसे करें:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' conf ': ['West', 'West', 'East', 'East'],
                   ' team ': ['A', 'B', 'C', 'D'],
                   ' position ': ['Guard', 'Forward', 'Guard', 'Center'] })

#view DataFrame
df

   conf team position
0 West A Guard
1 West B Forward
2 East C Guard
3 East D Center

उदाहरण 1: एक स्तंभ का गुणनखंड करें

निम्नलिखित कोड दिखाता है कि डेटाफ़्रेम में किसी कॉलम को कैसे फैक्टर किया जाए:

 #factorize the conf column only
df[' conf '] = pd. factorize (df[' conf '])[ 0 ]

#view updated DataFrame
df

	conf team position
0 0 A Guard
1 0 B Forward
2 1 C Guard
3 1 D Center

ध्यान दें कि केवल ‘conf’ कॉलम को फैक्टर किया गया है।

प्रत्येक मान जो “पश्चिम” था अब 0 है और प्रत्येक मान जो “पूर्व” था अब 1 है।

उदाहरण 2: कारक विशिष्ट कॉलम

निम्नलिखित कोड दिखाता है कि डेटाफ़्रेम में विशिष्ट कॉलमों को कैसे शामिल किया जाए:

 #factorize conf and team columns only
df[[' conf ', ' team ']] = df[[' conf ', ' team ']]. apply ( lambda x: pd.factorize (x)[ 0 ])

#view updated DataFrame
df

        conf team position
0 0 0 Guard
1 0 1 Forward
2 1 2 Guard
3 1 3 Center

ध्यान दें कि “conf” और “टीम” कॉलम दोनों को ध्यान में रखा गया है।

उदाहरण 3: सभी स्तंभों का गुणनखंड करें

निम्नलिखित कोड दिखाता है कि डेटाफ़्रेम में सभी कॉलमों को कैसे फैक्टर किया जाए:

 #factorize all columns
df = df. apply ( lambda x: pd.factorize (x)[ 0 ])

#view updated DataFrame
df

     conf team position
0 0 0 0
1 0 1 1
2 1 2 0
3 1 3 2

ध्यान दें कि सभी कॉलमों को ध्यान में रखा गया है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:

पांडा डेटाफ़्रेम कॉलम को स्ट्रिंग में कैसे बदलें
पंडों में श्रेणीबद्ध चर को संख्यात्मक में कैसे परिवर्तित करें
पांडा डेटाफ़्रेम कॉलम को पूर्णांक में कैसे परिवर्तित करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *