यादृच्छिक डेटा के साथ पांडा डेटाफ़्रेम कैसे बनाएं


आप यादृच्छिक पूर्णांकों से भरा पांडा डेटाफ़्रेम बनाने के लिए निम्नलिखित मूल वाक्यविन्यास का उपयोग कर सकते हैं:

 df = pd. DataFrame ( np.random.randint ( 0,100 ,size=( 10,3 )) , columns=list( ' ABC '))

यह विशेष उदाहरण 10 पंक्तियों और 3 स्तंभों वाला एक डेटाफ़्रेम बनाता है जहाँ डेटाफ़्रेम में प्रत्येक मान 0 और 100 के बीच एक यादृच्छिक पूर्णांक है।

निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस वाक्यविन्यास का उपयोग कैसे करें।

उदाहरण 1: यादृच्छिक डेटा के साथ एक पांडा डेटाफ़्रेम बनाएं

निम्नलिखित कोड दिखाता है कि 10 पंक्तियों और 3 स्तंभों के साथ एक पांडा डेटाफ़्रेम कैसे बनाया जाए, जहाँ डेटाफ़्रेम में प्रत्येक मान 0 और 100 के बीच एक यादृच्छिक पूर्णांक है:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ( np.random.randint ( 0,100 ,size=( 10,3 )), columns=list( ' ABC ') ) 

#view DataFrame
print (df)

    ABC
0 72 70 27
1 87 85 7
2 4 42 84
3 85 87 63
4 79 72 30
5 96 99 79
6 26 47 90
7 35 69 56
8 42 47 0
9 97 4 59

ध्यान दें कि हर बार जब आप यह कोड चलाएंगे, तो डेटाफ़्रेम में यादृच्छिक पूर्णांक भिन्न होंगे।

यदि आप एक प्रतिलिपि प्रस्तुत करने योग्य उदाहरण बनाना चाहते हैं जहां यादृच्छिक पूर्णांक हर बार समान होते हैं, तो आप डेटाफ़्रेम बनाने से तुरंत पहले कोड के निम्नलिखित टुकड़े का उपयोग कर सकते हैं:

 n.p. random . seed ( 0 )

अब, हर बार जब आप कोड चलाएंगे, तो डेटाफ़्रेम में यादृच्छिक पूर्णांक समान होंगे।

उदाहरण 2: मौजूदा डेटाफ़्रेम में एक रैंडम डेटा कॉलम जोड़ें

आइए मान लें कि हमारे पास निम्नलिखित मौजूदा पांडा डेटाफ़्रेम हैं:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

हम “रैंड” नामक एक नया कॉलम जोड़ने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं जिसमें 0 और 100 के बीच यादृच्छिक पूर्णांक शामिल हैं:

 import numpy as np

#add 'rand' column that contains 8 random integers between 0 and 100
df[' rand '] = np. random . randint ( 0,100 , size = ( 8,1 ))

#view updated DataFrame
print (df)

  team points assists rebounds rand
0 A 18 5 11 47
1 B 22 7 8 64
2 C 19 7 10 82
3 D 14 9 6 99
4 E 14 12 6 88
5 F 11 9 5 49
6 G 20 9 9 29
7:28 4 12 19

ध्यान दें कि नया कॉलम “रैंड” मौजूदा डेटाफ़्रेम में जोड़ा गया है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:

पांडा में लुप्त मानों को कैसे आरोपित करें
पांडा में NaN मान को शून्य से कैसे बदलें
पांडा में सेल खाली है या नहीं इसकी जांच कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *