Een getrimd gemiddelde in r berekenen (met voorbeelden)
Een getrimd gemiddelde is het gemiddelde van een dataset dat is berekend na het verwijderen van een specifiek percentage van de kleinste en grootste waarden in de dataset.
Een bijgesneden gemiddelde van 10% zou bijvoorbeeld het gemiddelde van een dataset vertegenwoordigen na het verwijderen van de kleinste 10% van de waarden en de grootste 10% van de waarden.
De eenvoudigste manier om een getrimd gemiddelde in R te berekenen, is door de volgende basissyntaxis te gebruiken:
#calculate 10% trimmed mean mean(x, trim= 0.1 )
De volgende voorbeelden laten zien hoe u deze functie kunt gebruiken om in de praktijk een getrimd gemiddelde te berekenen.
Voorbeeld 1: Bereken het getrimde gemiddelde van de vector
De volgende code laat zien hoe u een 10% bijgesneden gemiddelde voor een gegevensvector kunt berekenen:
#define data data = c(22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12) #calculate 10% trimmed mean mean(data, trim= 0.1 ) [1] 12,375
Het 10% getrimde gemiddelde is 12,375 .
Dit is het gemiddelde van de dataset nadat de kleinste 10% en de grootste 10% van de waarden uit de dataset zijn verwijderd.
Voorbeeld 2: Bereken het getrimde gemiddelde van de kolom in het dataframe
De volgende code laat zien hoe u een bijgesneden gemiddelde van 5% berekent voor een specifieke kolom in een gegevensframe:
#create data frame df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29), assists=c(5, 7, 7, 9, 12, 9, 9, 4), rebounds=c(11, 8, 10, 6, 6, 5, 9, 12)) #calculate 5% trimmed mean of points mean(df$points, trim= 0.05 ) [1] 20.25
Het 5% getrimde gemiddelde van de waarden in de kolom “punten” is 20,25 .
Dit is het gemiddelde van de kolom “punten” na het verwijderen van de 5% kleinste en 5% grootste waarden.
Voorbeeld 3: Bereken het getrimde gemiddelde van meerdere kolommen
De volgende code laat zien hoe u een bijgesneden gemiddelde van 5% berekent voor meerdere kolommen in een gegevensframe:
#create data frame df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29), assists=c(5, 7, 7, 9, 12, 9, 9, 4), rebounds=c(11, 8, 10, 6, 6, 5, 9, 12)) #calculate 5% trimmed mean of points and assists sapply(df[c(' points ', ' assists ')], function (x) mean(x, trim= 0.05 )) assist points 20.25 7.75
Uit het resultaat kunnen we zien:
- Het 5% getrimde gemiddelde van de “punten”-kolom is 20,25 .
- Het 5% getrimde gemiddelde van de kolom ‘assisten’ is 7,75 .
Gerelateerd: een handleiding voor apply(), lapply(), sapply() en tapply() in R
Aanvullende bronnen
De volgende tutorials bieden aanvullende informatie over getrimde gemiddelden:
Hoe u handmatig een getrimd gemiddelde kunt berekenen
Hoe een getrimd gemiddelde in Python te berekenen
Bijgesneden gemiddelde rekenmachine