पांडा में श्रेणीबद्ध चर कैसे बनाएं (उदाहरण के साथ)


आप पांडा में एक श्रेणीगत चर बनाने के लिए निम्नलिखित में से किसी भी विधि का उपयोग कर सकते हैं:

विधि 1: स्क्रैच से एक श्रेणीबद्ध चर बनाएँ

 df[' cat_variable '] = [' A ', ' B ', ' C ', ' D ']

विधि 2: मौजूदा संख्यात्मक चर से एक श्रेणीबद्ध चर बनाएं

 df[' cat_variable '] = pd. cut (df[' numeric_variable '],
                            bins=[ 0,15,25 ,float(' Inf ') ] ,
                            labels=[' Bad ', ' OK ', ' Good '])

निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में प्रत्येक विधि का उपयोग कैसे करें।

उदाहरण 1: स्क्रैच से एक श्रेणीबद्ध चर बनाएँ

निम्नलिखित कोड दिखाता है कि एक श्रेणीबद्ध चर जिसे टीम कहा जाता है और एक संख्यात्मक चर जिसे पॉइंट कहा जाता है, के साथ एक पांडा डेटाफ़्रेम कैसे बनाया जाए:

 import pandas as pd

#create DataFrame with one categorical variable and one numeric variable
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [12, 15, 19, 22, 24, 25, 26, 30]})

#view DataFrame
print (df)

  team points
0 to 12
1 B 15
2 C 19
3 D 22
4 E 24
5 F 25
6 G 26
7:30 a.m.

#view data type of each column in DataFrame
print ( df.dtypes )

team object
int64 dots
dtype:object

Df.dtypes का उपयोग करके हम DataFrame में प्रत्येक वेरिएबल का डेटा प्रकार देख सकते हैं।

हम देख सकते हैं:

  • टीम वेरिएबल एक ऑब्जेक्ट है।
  • पॉइंट वेरिएबल एक पूर्णांक है।

पायथन में, एक वस्तु एक वर्ण या “श्रेणीबद्ध” चर के बराबर होती है। इस प्रकार, टीम चर एक श्रेणीबद्ध चर है।

उदाहरण 2: मौजूदा संख्यात्मक चर से एक श्रेणीबद्ध चर बनाएं

निम्नलिखित कोड दिखाता है कि डेटाफ़्रेम में पॉइंट नामक मौजूदा संख्यात्मक चर से स्थिति नामक एक श्रेणीगत चर कैसे बनाया जाए:

 import pandas as pd

#create DataFrame with one categorical variable and one numeric variable
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [12, 15, 19, 22, 24, 25, 26, 30]})

#create categorical variable 'status' based on existing numerical 'points' variable
df[' status '] = pd. cut (df[' points '],
                      bins=[ 0,15,25 ,float(' Inf ') ] ,
                      labels=[' Bad ', ' OK ', ' Good '])

#view updated DataFrame
print (df)

  team points status
0 To 12 Bad
1 B 15 Bad
2 C 19 OK
3 D 22 OK
4 E 24 OK
5 F 25 OK
6 G 26 Good
7:30 a.m. Good

कट() फ़ंक्शन का उपयोग करके, हमने स्थिति नामक एक नया श्रेणीबद्ध चर बनाया जो निम्नलिखित मान लेता है:

  • खराब ‘ यदि अंक कॉलम में मान 15 से कम या उसके बराबर है।
  • अन्यथा, ‘ ठीक है ‘ यदि अंक कॉलम में मान 25 से कम या उसके बराबर है।
  • अन्यथा, ” अच्छा “।

ध्यान दें कि कट() फ़ंक्शन का उपयोग करते समय, लेबल की संख्या डिब्बे की संख्या से एक कम होनी चाहिए

हमारे उदाहरण में, हमने बक्सों के किनारों को परिभाषित करने के लिए बक्सों के लिए चार मानों का उपयोग किया और श्रेणीबद्ध चर के लिए उपयोग किए जाने वाले लेबलों को निर्दिष्ट करने के लिए लेबलों के लिए तीन मानों का उपयोग किया।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि अन्य सामान्य पांडा कार्य कैसे करें:

पांडा में डमी वेरिएबल कैसे बनाएं
पंडों में श्रेणीबद्ध चर को संख्यात्मक में कैसे परिवर्तित करें
पांडा में बूलियन मानों को पूर्णांक मानों में कैसे परिवर्तित करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *