Een getrimd gemiddelde in r berekenen (met voorbeelden)


Een getrimd gemiddelde is het gemiddelde van een dataset dat is berekend na het verwijderen van een specifiek percentage van de kleinste en grootste waarden in de dataset.

Een bijgesneden gemiddelde van 10% zou bijvoorbeeld het gemiddelde van een dataset vertegenwoordigen na het verwijderen van de kleinste 10% van de waarden en de grootste 10% van de waarden.

De eenvoudigste manier om een getrimd gemiddelde in R te berekenen, is door de volgende basissyntaxis te gebruiken:

 #calculate 10% trimmed mean
mean(x, trim= 0.1 )

De volgende voorbeelden laten zien hoe u deze functie kunt gebruiken om in de praktijk een getrimd gemiddelde te berekenen.

Voorbeeld 1: Bereken het getrimde gemiddelde van de vector

De volgende code laat zien hoe u een 10% bijgesneden gemiddelde voor een gegevensvector kunt berekenen:

 #define data
data = c(22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12)

#calculate 10% trimmed mean
mean(data, trim= 0.1 )

[1] 12,375

Het 10% getrimde gemiddelde is 12,375 .

Dit is het gemiddelde van de dataset nadat de kleinste 10% en de grootste 10% van de waarden uit de dataset zijn verwijderd.

Voorbeeld 2: Bereken het getrimde gemiddelde van de kolom in het dataframe

De volgende code laat zien hoe u een bijgesneden gemiddelde van 5% berekent voor een specifieke kolom in een gegevensframe:

 #create data frame
df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29),
                assists=c(5, 7, 7, 9, 12, 9, 9, 4),
                rebounds=c(11, 8, 10, 6, 6, 5, 9, 12))

#calculate 5% trimmed mean of points
mean(df$points, trim= 0.05 )

[1] 20.25

Het 5% getrimde gemiddelde van de waarden in de kolom “punten” is 20,25 .

Dit is het gemiddelde van de kolom “punten” na het verwijderen van de 5% kleinste en 5% grootste waarden.

Voorbeeld 3: Bereken het getrimde gemiddelde van meerdere kolommen

De volgende code laat zien hoe u een bijgesneden gemiddelde van 5% berekent voor meerdere kolommen in een gegevensframe:

 #create data frame
df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29),
                assists=c(5, 7, 7, 9, 12, 9, 9, 4),
                rebounds=c(11, 8, 10, 6, 6, 5, 9, 12))

#calculate 5% trimmed mean of points and assists
sapply(df[c(' points ', ' assists ')], function (x) mean(x, trim= 0.05 ))

 assist points 
  20.25 7.75 

Uit het resultaat kunnen we zien:

  • Het 5% getrimde gemiddelde van de “punten”-kolom is 20,25 .
  • Het 5% getrimde gemiddelde van de kolom ‘assisten’ is 7,75 .

Gerelateerd: een handleiding voor apply(), lapply(), sapply() en tapply() in R

Aanvullende bronnen

De volgende tutorials bieden aanvullende informatie over getrimde gemiddelden:

Hoe u handmatig een getrimd gemiddelde kunt berekenen
Hoe een getrimd gemiddelde in Python te berekenen
Bijgesneden gemiddelde rekenmachine

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert