पांडा में माध्य, माध्यिका और मोड की गणना कैसे करें


आप पांडा डेटाफ़्रेम में प्रत्येक संख्यात्मक कॉलम के माध्य, माध्य और मोड की गणना करने के लिए निम्नलिखित फ़ंक्शन का उपयोग कर सकते हैं:

 print ( df.mean (numeric_only= True ))
print (df. median (numeric_only= True ))
print (df. mode (numeric_only= True ))

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इन कार्यों का उपयोग कैसे करें।

उदाहरण: पांडा में माध्य, माध्यिका और बहुलक की गणना करें

मान लीजिए कि हमारे पास निम्नलिखित पांडा डेटाफ़्रेम है जिसमें चार अलग-अलग खेलों में विभिन्न बास्केटबॉल खिलाड़ियों द्वारा बनाए गए अंकों के बारे में जानकारी है:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' game1 ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' game2 ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' game3 ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' game4 ': [9, 8, 10, 9, 14, 15, 10, 11]})
                   
#view DataFrame
print (df)

  player game1 game2 game3 game4
0 A 18 5 11 9
1 B 22 7 8 8
2 C 19 7 10 10
3 D 14 9 6 9
4 E 14 12 6 14
5 F 11 9 5 15
6 G 20 9 9 10
7:28 4 12 11

हम प्रत्येक संख्यात्मक कॉलम के औसत मूल्य की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #calculate mean of each numeric column
print ( df.mean (numeric_only= True ))

game1 18,250
game2 7,750
game3 8.375
game4 10,750
dtype:float64

परिणाम से हम देख सकते हैं:

  • गेम1 कॉलम में औसत मान 18.25 है।
  • गेम2 कॉलम में औसत मान 7.75 है।
  • गेम3 कॉलम में औसत मान 8.375 है।
  • गेम4 कॉलम में औसत मान 10.75 है।

फिर हम प्रत्येक संख्यात्मक कॉलम के औसत मूल्य की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #calculate median of each numeric column
print (df. median (numeric_only= True ))

game1 18.5
game2 8.0
game3 8.5
game4 10.0
dtype:float64

परिणाम से हम देख सकते हैं:

  • गेम1 कॉलम में माध्य मान 18.5 है।
  • गेम2 कॉलम में माध्य मान 8 है।
  • गेम3 कॉलम में माध्य मान 8.5 है।
  • गेम4 कॉलम में माध्य मान 10 है।

फिर हम प्रत्येक संख्यात्मक कॉलम के मोड की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #calculate mode of each numeric column
print (df. mode (numeric_only= True ))

   game1 game2 game3 game4
0 14.0 9.0 6.0 9
1 NaN NaN NaN 10

परिणाम से हम देख सकते हैं:

  • गेम1 कॉलम में मोड 14 है।
  • गेम2 कॉलम में मोड 9 है।
  • गेम3 कॉलम में मोड 6 है।
  • गेम4 कॉलम में मोड 9 और 10 है

ध्यान दें कि गेम4 कॉलम में दो मोड थे क्योंकि दो मान थे जो उस कॉलम में सबसे अधिक बार दिखाई देते थे।

नोट : आप प्रत्येक कॉलम के लिए अधिक वर्णनात्मक आँकड़े उत्पन्न करने के लिए पांडा में वर्णन() फ़ंक्शन का भी उपयोग कर सकते हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि पांडा में अन्य सामान्य ऑपरेशन कैसे करें:

पांडा में समूह औसत की गणना कैसे करें
पांडा में समूह माध्यिका की गणना कैसे करें
पांडा में समूह द्वारा मोड की गणना कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *