पायथन में ट्रिम किए गए माध्य की गणना कैसे करें (उदाहरण के साथ)
ट्रिम किया गया माध्य एक डेटा सेट का औसत है जिसकी गणना डेटा सेट में सबसे छोटे और सबसे बड़े मानों के एक विशिष्ट प्रतिशत को हटाने के बाद की गई है।
पायथन में ट्रिम किए गए माध्य की गणना करने का सबसे आसान तरीका SciPy लाइब्रेरी से ट्रिम_मीन () फ़ंक्शन का उपयोग करना है।
यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:
from scipy import stats #calculate 10% trimmed mean stats. trim_mean (data, 0.1 )
निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में कम किए गए औसत की गणना करने के लिए इस फ़ंक्शन का उपयोग कैसे करें।
उदाहरण 1: तालिका के छंटे हुए माध्य की गणना करें
निम्नलिखित कोड दिखाता है कि डेटा तालिका के लिए 10% कम किए गए माध्य की गणना कैसे करें:
from scipy import stats #define data data = [22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12] #calculate 10% trimmed mean stats. trim_mean (data, 0.1 ) 12,375
10% कम किया गया माध्य 12.375 है।
डेटासेट से सबसे छोटे 10% और सबसे बड़े 10% मान हटा दिए जाने के बाद यह डेटासेट का औसत है।
उदाहरण 2: पांडा में कॉलम के ट्रिम किए गए माध्य की गणना करें
निम्नलिखित कोड दिखाता है कि पांडा डेटाफ़्रेम में किसी विशिष्ट कॉलम के लिए 5% ट्रिम किए गए औसत की गणना कैसे करें:
from scipy import stats import pandas as pd #define DataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #calculate 5% trimmed mean of points stats. trim_mean (df. points , 0.05 ) 20.25
“अंक” कॉलम में मानों का 5% छंटनी वाला औसत 20.25 है।
5% सबसे छोटे और 5% सबसे बड़े मानों को हटाने के बाद यह “अंक” कॉलम का औसत है।
उदाहरण 3: एकाधिक स्तंभों के छंटनी किए गए माध्य की गणना करें
निम्नलिखित कोड दिखाता है कि पांडा डेटाफ़्रेम में एकाधिक कॉलम के लिए 5% ट्रिम किए गए औसत की गणना कैसे करें:
from scipy import stats import pandas as pd #define DataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #calculate 5% trimmed mean of 'points' and 'assists' columns stats. trim_mean (df[[' points ', ' assists ']], 0.05 ) array([20.25, 7.75])
परिणाम से हम देख सकते हैं:
- “अंक” कॉलम का 5% छंटनी वाला औसत 20.25 है।
- “सहायता” कॉलम का 5% छंटनी वाला औसत 7.75 है।
नोट : आप यहां trim_mean() फ़ंक्शन के लिए संपूर्ण दस्तावेज़ पा सकते हैं।
अतिरिक्त संसाधन
ट्रिम किए गए माध्य की मैन्युअल रूप से गणना कैसे करें
ट्रिम किया गया माध्य कैलकुलेटर