Come calcolare un errore standard di bootstrap in r


Il bootstrap è un metodo che può essere utilizzato per stimare l’errore standard di una media.

Il processo di base per il calcolo di un errore standard bootstrap è il seguente:

  • Prendi k campioni replicati con sostituzione da un dato set di dati.
  • Per ciascun campione, calcolare l’errore standard: s/√ n
  • Ciò si traduce in k stime diverse dell’errore standard. Per trovare l’errore standard bootstrap, prendi la media dei k errori standard.

Gli esempi seguenti spiegano due diversi metodi che possono essere utilizzati per calcolare un errore standard bootstrap in R.

Metodo 1: utilizzare il pacchetto iniziale

Un modo per calcolare un errore standard di avvio in R è utilizzare la funzione boot() dalla libreria di avvio .

Il codice seguente mostra come calcolare un errore standard di bootstrap per un determinato set di dati in R:

 #make this example reproducible
set. seeds (10)

#load boot library
library (boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

#define function to calculate mean
meanFunc <- function (x,i){mean(x[i])}

#calculate standard error using 100 bootstrapped samples
boot(x, meanFunc, 100)

Bootstrap Statistics:
    original bias std. error
t1* 21.5 0.254 2.379263

Il valore “originale” di 21,5 mostra la media del set di dati originale. Il “st. Il valore di 2.379263 indica l’errore standard bootstrap della media.

Tieni presente che in questo esempio abbiamo utilizzato 100 campioni sottoposti a bootstrap per stimare l’errore standard della media, ma avremmo potuto utilizzare 1.000 o 10.000 o qualsiasi numero di campioni sottoposti a bootstrap volessimo.

Metodo 2: Scrivi la tua formula

Un altro modo per calcolare un errore standard bootstrap è scrivere la nostra funzione.

Il codice seguente mostra come eseguire questa operazione:

 #make this example reproducible
set. seeds (10)

#load boot library
library (boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

mean(replicate(100, sd( sample (x, replace= T ))/sqrt( length (x))))

[1] 2.497414

L’errore standard avviato risulta essere 2.497414 .

Si noti che questo errore standard è abbastanza simile a quello calcolato nell’esempio precedente.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *