Come calcolare un errore standard di bootstrap in r
Il bootstrap è un metodo che può essere utilizzato per stimare l’errore standard di una media.
Il processo di base per il calcolo di un errore standard bootstrap è il seguente:
- Prendi k campioni replicati con sostituzione da un dato set di dati.
- Per ciascun campione, calcolare l’errore standard: s/√ n
- Ciò si traduce in k stime diverse dell’errore standard. Per trovare l’errore standard bootstrap, prendi la media dei k errori standard.
Gli esempi seguenti spiegano due diversi metodi che possono essere utilizzati per calcolare un errore standard bootstrap in R.
Metodo 1: utilizzare il pacchetto iniziale
Un modo per calcolare un errore standard di avvio in R è utilizzare la funzione boot() dalla libreria di avvio .
Il codice seguente mostra come calcolare un errore standard di bootstrap per un determinato set di dati in R:
#make this example reproducible set. seeds (10) #load boot library library (boot) #define dataset x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35) #define function to calculate mean meanFunc <- function (x,i){mean(x[i])} #calculate standard error using 100 bootstrapped samples boot(x, meanFunc, 100) Bootstrap Statistics: original bias std. error t1* 21.5 0.254 2.379263
Il valore “originale” di 21,5 mostra la media del set di dati originale. Il “st. Il valore di 2.379263 indica l’errore standard bootstrap della media.
Tieni presente che in questo esempio abbiamo utilizzato 100 campioni sottoposti a bootstrap per stimare l’errore standard della media, ma avremmo potuto utilizzare 1.000 o 10.000 o qualsiasi numero di campioni sottoposti a bootstrap volessimo.
Metodo 2: Scrivi la tua formula
Un altro modo per calcolare un errore standard bootstrap è scrivere la nostra funzione.
Il codice seguente mostra come eseguire questa operazione:
#make this example reproducible set. seeds (10) #load boot library library (boot) #define dataset x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35) mean(replicate(100, sd( sample (x, replace= T ))/sqrt( length (x)))) [1] 2.497414
L’errore standard avviato risulta essere 2.497414 .
Si noti che questo errore standard è abbastanza simile a quello calcolato nell’esempio precedente.