Come calcolare una media troncata in r (con esempi)


Una media troncata è la media di un set di dati che è stata calcolata dopo aver rimosso una percentuale specifica dei valori più piccoli e più grandi nel set di dati.

Ad esempio, una media troncata del 10% rappresenterebbe la media di un set di dati dopo aver rimosso il 10% più piccolo dei valori e il 10% più grande dei valori.

Il modo più semplice per calcolare una media troncata in R è utilizzare la seguente sintassi di base:

 #calculate 10% trimmed mean
mean(x, trim= 0.1 )

Gli esempi seguenti mostrano come utilizzare nella pratica questa funzione per calcolare una media troncata.

Esempio 1: calcolare la media troncata del vettore

Il codice seguente mostra come calcolare una media troncata del 10% per un vettore di dati:

 #define data
data = c(22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12)

#calculate 10% trimmed mean
mean(data, trim= 0.1 )

[1] 12,375

La media troncata al 10% è 12.375 .

Questa è la media del set di dati dopo che il 10% più piccolo e il 10% più grande dei valori sono stati rimossi dal set di dati.

Esempio 2: calcola la media troncata della colonna nel frame di dati

Il codice seguente mostra come calcolare una media troncata del 5% per una colonna specifica in un frame di dati:

 #create data frame
df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29),
                assists=c(5, 7, 7, 9, 12, 9, 9, 4),
                rebounds=c(11, 8, 10, 6, 6, 5, 9, 12))

#calculate 5% trimmed mean of points
mean(df$points, trim= 0.05 )

[1] 20.25

La media troncata al 5% dei valori nella colonna “punti” è 20,25 .

Questa è la media della colonna “punti” dopo aver rimosso i valori 5% più piccoli e 5% più grandi.

Esempio 3: calcolare la media troncata di più colonne

Il codice seguente mostra come calcolare una media troncata del 5% per più colonne in un frame di dati:

 #create data frame
df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29),
                assists=c(5, 7, 7, 9, 12, 9, 9, 4),
                rebounds=c(11, 8, 10, 6, 6, 5, 9, 12))

#calculate 5% trimmed mean of points and assists
sapply(df[c(' points ', ' assists ')], function (x) mean(x, trim= 0.05 ))

 assist points 
  20.25 7.75 

Dal risultato possiamo vedere:

  • La media troncata del 5% della colonna “punti” è 20,25 .
  • La media troncata al 5% della colonna “assist” è 7,75 .

Correlati: una guida per apply(), lapply(), sapply() e tapply() in R

Risorse addizionali

Le seguenti esercitazioni forniscono informazioni aggiuntive sulle medie troncate:

Come calcolare manualmente una media troncata
Come calcolare una media troncata in Python
Calcolatore della media troncata

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *