So berechnen sie einen getrimmten mittelwert in r (mit beispielen)


Ein getrimmter Mittelwert ist der Durchschnitt eines Datensatzes, der nach Entfernung eines bestimmten Prozentsatzes der kleinsten und größten Werte im Datensatz berechnet wurde.

Ein um 10 % getrimmter Mittelwert würde beispielsweise den Durchschnitt eines Datensatzes darstellen, nachdem die kleinsten 10 % der Werte und die größten 10 % der Werte entfernt wurden.

Der einfachste Weg, einen getrimmten Mittelwert in R zu berechnen, ist die Verwendung der folgenden grundlegenden Syntax:

 #calculate 10% trimmed mean
mean(x, trim= 0.1 )

Die folgenden Beispiele zeigen, wie Sie diese Funktion zur Berechnung eines getrimmten Durchschnitts in der Praxis verwenden.

Beispiel 1: Berechnen Sie den getrimmten Mittelwert des Vektors

Der folgende Code zeigt, wie ein um 10 % getrimmter Mittelwert für einen Datenvektor berechnet wird:

 #define data
data = c(22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12)

#calculate 10% trimmed mean
mean(data, trim= 0.1 )

[1] 12,375

Der auf 10 % getrimmte Mittelwert beträgt 12,375 .

Dies ist der Durchschnitt des Datensatzes, nachdem die kleinsten 10 % und die größten 10 % der Werte aus dem Datensatz entfernt wurden.

Beispiel 2: Berechnen Sie den getrimmten Mittelwert der Spalte im Datenrahmen

Der folgende Code zeigt, wie ein um 5 % gekürzter Durchschnitt für eine bestimmte Spalte in einem Datenrahmen berechnet wird:

 #create data frame
df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29),
                assists=c(5, 7, 7, 9, 12, 9, 9, 4),
                rebounds=c(11, 8, 10, 6, 6, 5, 9, 12))

#calculate 5% trimmed mean of points
mean(df$points, trim= 0.05 )

[1] 20.25

Der um 5 % gekürzte Durchschnitt der Werte in der Spalte „Punkte“ beträgt 20,25 .

Dies ist der Durchschnitt der Spalte „Punkte“ nach Entfernung der 5 % kleinsten und 5 % größten Werte.

Beispiel 3: Berechnen Sie den getrimmten Mittelwert mehrerer Spalten

Der folgende Code zeigt, wie ein um 5 % gekürzter Durchschnitt für mehrere Spalten in einem Datenrahmen berechnet wird:

 #create data frame
df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29),
                assists=c(5, 7, 7, 9, 12, 9, 9, 4),
                rebounds=c(11, 8, 10, 6, 6, 5, 9, 12))

#calculate 5% trimmed mean of points and assists
sapply(df[c(' points ', ' assists ')], function (x) mean(x, trim= 0.05 ))

 assist points 
  20.25 7.75 

Aus dem Ergebnis können wir sehen:

  • Der um 5 % gekürzte Durchschnitt der Spalte „Punkte“ beträgt 20,25 .
  • Der um 5 % gekürzte Durchschnitt der Spalte „Unterstützungen“ beträgt 7,75 .

Verwandt: Eine Anleitung zu apply(), lapply(), sapply() und tapply() in R

Zusätzliche Ressourcen

Die folgenden Tutorials bieten zusätzliche Informationen zu getrimmten Durchschnitten:

So berechnen Sie manuell einen getrimmten Mittelwert
So berechnen Sie einen getrimmten Mittelwert in Python
Rechner für getrimmte Mittelwerte

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert