पायथन में यूनीवेरिएट विश्लेषण कैसे करें: उदाहरणों के साथ
यूनीवेरिएट विश्लेषण शब्द का तात्पर्य एक चर के विश्लेषण से है। आप इसे याद रख सकते हैं क्योंकि उपसर्ग “यूनी” का अर्थ “एक” है।
किसी चर पर अविभाज्य विश्लेषण करने के तीन सामान्य तरीके हैं:
1. सारांश सांख्यिकी – मूल्यों के केंद्र और वितरण को मापता है।
2. आवृत्ति तालिका – बताती है कि कितनी बार विभिन्न मान प्रकट होते हैं।
3. चार्ट – मूल्यों के वितरण की कल्पना करने के लिए उपयोग किया जाता है।
यह ट्यूटोरियल निम्नलिखित पांडा डेटाफ़्रेम के साथ यूनीवेरिएट विश्लेषण कैसे करें इसका एक उदाहरण प्रदान करता है:
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [1, 1, 2, 3.5, 4, 4, 4, 5, 5, 6.5, 7, 7.4, 8, 13, 14.2], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 6, 8, 8, 9, 3, 2, 6], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 6, 6, 7, 8, 7, 9, 15]}) #view first five rows of DataFrame df. head () points assists rebounds 0 1.0 5 11 1 1.0 7 8 2 2.0 7 10 3 3.5 9 6 4 4.0 12 6
1. सारांश आँकड़ों की गणना करें
हम डेटाफ़्रेम में “अंक” चर के लिए विभिन्न सारांश आंकड़ों की गणना करने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
#calculate mean of 'points' df[' points ']. mean () 5.706666666666667 #calculate median of 'points' df[' points ']. median () 5.0 #calculate standard deviation of 'points' df[' points ']. std () 3.858287308169384
2. एक आवृत्ति तालिका बनाएं
हम वेरिएबल ‘पॉइंट्स’ के लिए आवृत्ति तालिका बनाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
#create frequency table for 'points' df[' points ']. value_counts () 4.0 3 1.0 2 5.0 2 2.0 1 3.5 1 6.5 1 7.0 1 7.4 1 8.0 1 13.0 1 14.2 1 Name: points, dtype: int64
यह हमें बताता है कि:
- मान 4 3 बार प्रकट होता है
- मान 1 दो बार प्रकट होता है
- मान 5 दो बार प्रकट होता है
- मान 2 1 बार प्रकट होता है
और इसी तरह।
संबंधित: पायथन में फ़्रीक्वेंसी टेबल कैसे बनाएं
3. चार्ट बनाएं
हम ‘पॉइंट’ वेरिएबल के लिए बॉक्सप्लॉट बनाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
import matplotlib. pyplot as plt df. boxplot (column=[' points '], grid= False , color=' black ')
संबंधित: पांडास डेटाफ़्रेम से बॉक्सप्लॉट कैसे बनाएं
हम ‘पॉइंट’ वेरिएबल के लिए हिस्टोग्राम बनाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
import matplotlib. pyplot as plt df. hist (column=' points ', grid= False , edgecolor=' black ')
संबंधित: पांडास डेटाफ़्रेम से हिस्टोग्राम कैसे बनाएं
हम “अंक” चर के लिए घनत्व वक्र बनाने के लिए निम्नलिखित सिंटैक्स का उपयोग कर सकते हैं:
import seaborn as sns sns. kdeplot (df[' points '])
संबंधित: मैटप्लोटलिब में डेंसिटी प्लॉट कैसे बनाएं
इनमें से प्रत्येक ग्राफ़ हमें “अंक” चर के मूल्यों के वितरण की कल्पना करने का एक अनूठा तरीका देता है।