So berechnen sie einen getrimmten mittelwert in python (mit beispielen)


Ein getrimmter Mittelwert ist der Durchschnitt eines Datensatzes, der nach Entfernen eines bestimmten Prozentsatzes der kleinsten und größten Werte im Datensatz berechnet wurde.

Der einfachste Weg, einen getrimmten Mittelwert in Python zu berechnen, ist die Verwendung der Funktion trim_mean() aus der SciPy-Bibliothek.

Diese Funktion verwendet die folgende grundlegende Syntax:

 from scipy import stats

#calculate 10% trimmed mean
stats. trim_mean (data, 0.1 )

Die folgenden Beispiele zeigen, wie Sie diese Funktion zur Berechnung eines getrimmten Durchschnitts in der Praxis verwenden.

Beispiel 1: Berechnen Sie den getrimmten Mittelwert der Tabelle

Der folgende Code zeigt, wie ein um 10 % getrimmter Mittelwert für eine Datentabelle berechnet wird:

 from scipy import stats

#define data
data = [22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12]

#calculate 10% trimmed mean
stats. trim_mean (data, 0.1 )

12,375

Der auf 10 % getrimmte Mittelwert beträgt 12,375 .

Dies ist der Durchschnitt des Datensatzes, nachdem die kleinsten 10 % und die größten 10 % der Werte aus dem Datensatz entfernt wurden.

Beispiel 2: Berechnen Sie den getrimmten Mittelwert der Spalte in Pandas

Der folgende Code zeigt, wie ein um 5 % gekürzter Durchschnitt für eine bestimmte Spalte in einem Pandas-DataFrame berechnet wird:

 from scipy import stats
import pandas as pd

#define DataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})


#calculate 5% trimmed mean of points
stats. trim_mean (df. points , 0.05 ) 

20.25

Der um 5 % gekürzte Durchschnitt der Werte in der Spalte „Punkte“ beträgt 20,25 .

Dies ist der Durchschnitt der Spalte „Punkte“ nach Entfernung der 5 % kleinsten und 5 % größten Werte.

Beispiel 3: Berechnen Sie den getrimmten Mittelwert mehrerer Spalten

Der folgende Code zeigt, wie ein um 5 % gekürzter Durchschnitt für mehrere Spalten in einem Pandas-DataFrame berechnet wird:

 from scipy import stats
import pandas as pd

#define DataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})


#calculate 5% trimmed mean of 'points' and 'assists' columns
stats. trim_mean (df[[' points ', ' assists ']], 0.05 )

array([20.25, 7.75])

Aus dem Ergebnis können wir sehen:

  • Der um 5 % gekürzte Durchschnitt der Spalte „Punkte“ beträgt 20,25 .
  • Der um 5 % gekürzte Durchschnitt der Spalte „Unterstützungen“ beträgt 7,75 .

Hinweis : Die vollständige Dokumentation für die Funktion trim_mean() finden Sie hier .

Zusätzliche Ressourcen

So berechnen Sie manuell einen getrimmten Mittelwert
Rechner für getrimmte Mittelwerte

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert