Come calcolare una media troncata in r (con esempi)
Una media troncata è la media di un set di dati che è stata calcolata dopo aver rimosso una percentuale specifica dei valori più piccoli e più grandi nel set di dati.
Ad esempio, una media troncata del 10% rappresenterebbe la media di un set di dati dopo aver rimosso il 10% più piccolo dei valori e il 10% più grande dei valori.
Il modo più semplice per calcolare una media troncata in R è utilizzare la seguente sintassi di base:
#calculate 10% trimmed mean mean(x, trim= 0.1 )
Gli esempi seguenti mostrano come utilizzare nella pratica questa funzione per calcolare una media troncata.
Esempio 1: calcolare la media troncata del vettore
Il codice seguente mostra come calcolare una media troncata del 10% per un vettore di dati:
#define data data = c(22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12) #calculate 10% trimmed mean mean(data, trim= 0.1 ) [1] 12,375
La media troncata al 10% è 12.375 .
Questa è la media del set di dati dopo che il 10% più piccolo e il 10% più grande dei valori sono stati rimossi dal set di dati.
Esempio 2: calcola la media troncata della colonna nel frame di dati
Il codice seguente mostra come calcolare una media troncata del 5% per una colonna specifica in un frame di dati:
#create data frame df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29), assists=c(5, 7, 7, 9, 12, 9, 9, 4), rebounds=c(11, 8, 10, 6, 6, 5, 9, 12)) #calculate 5% trimmed mean of points mean(df$points, trim= 0.05 ) [1] 20.25
La media troncata al 5% dei valori nella colonna “punti” è 20,25 .
Questa è la media della colonna “punti” dopo aver rimosso i valori 5% più piccoli e 5% più grandi.
Esempio 3: calcolare la media troncata di più colonne
Il codice seguente mostra come calcolare una media troncata del 5% per più colonne in un frame di dati:
#create data frame df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29), assists=c(5, 7, 7, 9, 12, 9, 9, 4), rebounds=c(11, 8, 10, 6, 6, 5, 9, 12)) #calculate 5% trimmed mean of points and assists sapply(df[c(' points ', ' assists ')], function (x) mean(x, trim= 0.05 )) assist points 20.25 7.75
Dal risultato possiamo vedere:
- La media troncata del 5% della colonna “punti” è 20,25 .
- La media troncata al 5% della colonna “assist” è 7,75 .
Correlati: una guida per apply(), lapply(), sapply() e tapply() in R
Risorse addizionali
Le seguenti esercitazioni forniscono informazioni aggiuntive sulle medie troncate:
Come calcolare manualmente una media troncata
Come calcolare una media troncata in Python
Calcolatore della media troncata