Python'da kesilmiş ortalama nasıl hesaplanır (örneklerle)
Kırpılmış ortalama, veri kümesindeki en küçük ve en büyük değerlerin belirli bir yüzdesinin çıkarılmasından sonra hesaplanan bir veri kümesinin ortalamasıdır.
Python’da kırpılmış ortalamayı hesaplamanın en kolay yolu SciPy kütüphanesindeki trim_mean() fonksiyonunu kullanmaktır.
Bu işlev aşağıdaki temel sözdizimini kullanır:
from scipy import stats #calculate 10% trimmed mean stats. trim_mean (data, 0.1 )
Aşağıdaki örnekler, pratikte kırpılmış bir ortalamayı hesaplamak için bu fonksiyonun nasıl kullanılacağını göstermektedir.
Örnek 1: Tablonun kırpılmış ortalamasını hesaplayın
Aşağıdaki kod, bir veri tablosu için %10’luk kırpılmış ortalamanın nasıl hesaplanacağını gösterir:
from scipy import stats #define data data = [22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12] #calculate 10% trimmed mean stats. trim_mean (data, 0.1 ) 12,375
%10’luk düzeltilmiş ortalama 12.375’tir .
Bu, değerlerin en küçük %10’u ve en büyük %10’u veri kümesinden çıkarıldıktan sonra veri kümesinin ortalamasıdır.
Örnek 2: Pandalarda Sütunun Kesilmiş Ortalamasını Hesaplama
Aşağıdaki kod, bir pandas DataFrame’deki belirli bir sütun için %5’lik kırpılmış ortalamanın nasıl hesaplanacağını gösterir:
from scipy import stats import pandas as pd #define DataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #calculate 5% trimmed mean of points stats. trim_mean (df. points , 0.05 ) 20.25
“Puan” sütunundaki değerlerin %5 kırpılmış ortalaması 20,25’tir .
Bu, %5 en küçük ve %5 en büyük değerlerin çıkarılmasından sonraki “puan” sütununun ortalamasıdır.
Örnek 3: Birden fazla sütunun kırpılmış ortalamasını hesaplama
Aşağıdaki kod, bir pandas DataFrame’deki birden çok sütun için %5’lik kırpılmış ortalamanın nasıl hesaplanacağını gösterir:
from scipy import stats import pandas as pd #define DataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #calculate 5% trimmed mean of 'points' and 'assists' columns stats. trim_mean (df[[' points ', ' assists ']], 0.05 ) array([20.25, 7.75])
Sonuçtan şunları görebiliriz:
- “Puan” sütununun %5’lik kırpılmış ortalaması 20,25’tir .
- “Asist” sütununun %5’lik kısaltılmış ortalaması 7,75’tir .
Not : trim_mean() işlevine ilişkin tüm belgeleri burada bulabilirsiniz.
Ek kaynaklar
Kesilmiş Ortalamanın Manuel Olarak Hesaplanması
Kesilmiş Ortalama Hesaplayıcı