पायथन में यूनीवेरिएट विश्लेषण कैसे करें: उदाहरणों के साथ


यूनीवेरिएट विश्लेषण शब्द का तात्पर्य एक चर के विश्लेषण से है। आप इसे याद रख सकते हैं क्योंकि उपसर्ग “यूनी” का अर्थ “एक” है।

किसी चर पर अविभाज्य विश्लेषण करने के तीन सामान्य तरीके हैं:

1. सारांश सांख्यिकी – मूल्यों के केंद्र और वितरण को मापता है।

2. आवृत्ति तालिका – बताती है कि कितनी बार विभिन्न मान प्रकट होते हैं।

3. चार्ट – मूल्यों के वितरण की कल्पना करने के लिए उपयोग किया जाता है।

यह ट्यूटोरियल निम्नलिखित पांडा डेटाफ़्रेम के साथ यूनीवेरिएट विश्लेषण कैसे करें इसका एक उदाहरण प्रदान करता है:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [1, 1, 2, 3.5, 4, 4, 4, 5, 5, 6.5, 7, 7.4, 8, 13, 14.2],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 6, 8, 8, 9, 3, 2, 6],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 6, 6, 7, 8, 7, 9, 15]})

#view first five rows of DataFrame
df. head ()

	points assists rebounds
0 1.0 5 11
1 1.0 7 8
2 2.0 7 10
3 3.5 9 6
4 4.0 12 6

1. सारांश आँकड़ों की गणना करें

हम डेटाफ़्रेम में “अंक” चर के लिए विभिन्न सारांश आंकड़ों की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #calculate mean of 'points'
df[' points ']. mean ()

5.706666666666667

#calculate median of 'points' 
df[' points ']. median () 

5.0

#calculate standard deviation of 'points'
df[' points ']. std () 

3.858287308169384

2. एक आवृत्ति तालिका बनाएं

हम वेरिएबल ‘पॉइंट्स’ के लिए आवृत्ति तालिका बनाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 #create frequency table for 'points'
df[' points ']. value_counts ()

4.0 3
1.0 2
5.0 2
2.0 1
3.5 1
6.5 1
7.0 1
7.4 1
8.0 1
13.0 1
14.2 1
Name: points, dtype: int64

यह हमें बताता है कि:

  • मान 4 3 बार प्रकट होता है
  • मान 1 दो बार प्रकट होता है
  • मान 5 दो बार प्रकट होता है
  • मान 2 1 बार प्रकट होता है

और इसी तरह।

संबंधित: पायथन में फ़्रीक्वेंसी टेबल कैसे बनाएं

3. चार्ट बनाएं

हम ‘पॉइंट’ वेरिएबल के लिए बॉक्सप्लॉट बनाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 import matplotlib. pyplot as plt

df. boxplot (column=[' points '], grid= False , color=' black ')

संबंधित: पांडास डेटाफ़्रेम से बॉक्सप्लॉट कैसे बनाएं

हम ‘पॉइंट’ वेरिएबल के लिए हिस्टोग्राम बनाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 import matplotlib. pyplot as plt

df. hist (column=' points ', grid= False , edgecolor=' black ')

संबंधित: पांडास डेटाफ़्रेम से हिस्टोग्राम कैसे बनाएं

हम “अंक” चर के लिए घनत्व वक्र बनाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:

 import seaborn as sns

sns. kdeplot (df[' points '])

संबंधित: मैटप्लोटलिब में डेंसिटी प्लॉट कैसे बनाएं

इनमें से प्रत्येक ग्राफ़ हमें “अंक” चर के मूल्यों के वितरण की कल्पना करने का एक अनूठा तरीका देता है।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *