पायथन में ट्रिम किए गए माध्य की गणना कैसे करें (उदाहरण के साथ)


ट्रिम किया गया माध्य एक डेटा सेट का औसत है जिसकी गणना डेटा सेट में सबसे छोटे और सबसे बड़े मानों के एक विशिष्ट प्रतिशत को हटाने के बाद की गई है।

पायथन में ट्रिम किए गए माध्य की गणना करने का सबसे आसान तरीका SciPy लाइब्रेरी से ट्रिम_मीन () फ़ंक्शन का उपयोग करना है।

यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:

 from scipy import stats

#calculate 10% trimmed mean
stats. trim_mean (data, 0.1 )

निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में कम किए गए औसत की गणना करने के लिए इस फ़ंक्शन का उपयोग कैसे करें।

उदाहरण 1: तालिका के छंटे हुए माध्य की गणना करें

निम्नलिखित कोड दिखाता है कि डेटा तालिका के लिए 10% कम किए गए माध्य की गणना कैसे करें:

 from scipy import stats

#define data
data = [22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12]

#calculate 10% trimmed mean
stats. trim_mean (data, 0.1 )

12,375

10% कम किया गया माध्य 12.375 है।

डेटासेट से सबसे छोटे 10% और सबसे बड़े 10% मान हटा दिए जाने के बाद यह डेटासेट का औसत है।

उदाहरण 2: पांडा में कॉलम के ट्रिम किए गए माध्य की गणना करें

निम्नलिखित कोड दिखाता है कि पांडा डेटाफ़्रेम में किसी विशिष्ट कॉलम के लिए 5% ट्रिम किए गए औसत की गणना कैसे करें:

 from scipy import stats
import pandas as pd

#define DataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})


#calculate 5% trimmed mean of points
stats. trim_mean (df. points , 0.05 ) 

20.25

“अंक” कॉलम में मानों का 5% छंटनी वाला औसत 20.25 है।

5% सबसे छोटे और 5% सबसे बड़े मानों को हटाने के बाद यह “अंक” कॉलम का औसत है।

उदाहरण 3: एकाधिक स्तंभों के छंटनी किए गए माध्य की गणना करें

निम्नलिखित कोड दिखाता है कि पांडा डेटाफ़्रेम में एकाधिक कॉलम के लिए 5% ट्रिम किए गए औसत की गणना कैसे करें:

 from scipy import stats
import pandas as pd

#define DataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})


#calculate 5% trimmed mean of 'points' and 'assists' columns
stats. trim_mean (df[[' points ', ' assists ']], 0.05 )

array([20.25, 7.75])

परिणाम से हम देख सकते हैं:

  • “अंक” कॉलम का 5% छंटनी वाला औसत 20.25 है।
  • “सहायता” कॉलम का 5% छंटनी वाला औसत 7.75 है।

नोट : आप यहां trim_mean() फ़ंक्शन के लिए संपूर्ण दस्तावेज़ पा सकते हैं।

अतिरिक्त संसाधन

ट्रिम किए गए माध्य की मैन्युअल रूप से गणना कैसे करें
ट्रिम किया गया माध्य कैलकुलेटर

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *