So berechnen sie einen getrimmten mittelwert in python (mit beispielen)
Ein getrimmter Mittelwert ist der Durchschnitt eines Datensatzes, der nach Entfernen eines bestimmten Prozentsatzes der kleinsten und größten Werte im Datensatz berechnet wurde.
Der einfachste Weg, einen getrimmten Mittelwert in Python zu berechnen, ist die Verwendung der Funktion trim_mean() aus der SciPy-Bibliothek.
Diese Funktion verwendet die folgende grundlegende Syntax:
from scipy import stats #calculate 10% trimmed mean stats. trim_mean (data, 0.1 )
Die folgenden Beispiele zeigen, wie Sie diese Funktion zur Berechnung eines getrimmten Durchschnitts in der Praxis verwenden.
Beispiel 1: Berechnen Sie den getrimmten Mittelwert der Tabelle
Der folgende Code zeigt, wie ein um 10 % getrimmter Mittelwert für eine Datentabelle berechnet wird:
from scipy import stats #define data data = [22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12] #calculate 10% trimmed mean stats. trim_mean (data, 0.1 ) 12,375
Der auf 10 % getrimmte Mittelwert beträgt 12,375 .
Dies ist der Durchschnitt des Datensatzes, nachdem die kleinsten 10 % und die größten 10 % der Werte aus dem Datensatz entfernt wurden.
Beispiel 2: Berechnen Sie den getrimmten Mittelwert der Spalte in Pandas
Der folgende Code zeigt, wie ein um 5 % gekürzter Durchschnitt für eine bestimmte Spalte in einem Pandas-DataFrame berechnet wird:
from scipy import stats import pandas as pd #define DataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #calculate 5% trimmed mean of points stats. trim_mean (df. points , 0.05 ) 20.25
Der um 5 % gekürzte Durchschnitt der Werte in der Spalte „Punkte“ beträgt 20,25 .
Dies ist der Durchschnitt der Spalte „Punkte“ nach Entfernung der 5 % kleinsten und 5 % größten Werte.
Beispiel 3: Berechnen Sie den getrimmten Mittelwert mehrerer Spalten
Der folgende Code zeigt, wie ein um 5 % gekürzter Durchschnitt für mehrere Spalten in einem Pandas-DataFrame berechnet wird:
from scipy import stats import pandas as pd #define DataFrame df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #calculate 5% trimmed mean of 'points' and 'assists' columns stats. trim_mean (df[[' points ', ' assists ']], 0.05 ) array([20.25, 7.75])
Aus dem Ergebnis können wir sehen:
- Der um 5 % gekürzte Durchschnitt der Spalte „Punkte“ beträgt 20,25 .
- Der um 5 % gekürzte Durchschnitt der Spalte „Unterstützungen“ beträgt 7,75 .
Hinweis : Die vollständige Dokumentation für die Funktion trim_mean() finden Sie hier .
Zusätzliche Ressourcen
So berechnen Sie manuell einen getrimmten Mittelwert
Rechner für getrimmte Mittelwerte