Come eseguire il bootstrap in excel (con esempio)
Il bootstrap è un metodo che può essere utilizzato per costruire un intervallo di confidenza per una statistica quando la dimensione del campione è piccola e la distribuzione sottostante è sconosciuta.
Il processo di base per il bootstrap è il seguente:
- Prendi k campioni replicati con sostituzione da un dato set di dati.
- Per ciascun campione, calcolare la statistica di interesse.
- Ciò fornisce k stime diverse per una determinata statistica, che puoi quindi utilizzare per calcolare un intervallo di confidenza per la statistica.
Il seguente esempio dettagliato mostra come eseguire il bootstrap in Excel.
Passaggio 1: inserisci i dati originali
Innanzitutto, inseriremo i valori da un set di dati:
Passaggio 2: genera esempi di bootstrap
Successivamente, utilizzeremo la seguente formula per generare esempi di bootstrap:
=INDEX( $A$2:$A$16 , RANDBETWEEN(1, ROWS( $A$2:$A$16 )),1)
Possiamo digitare questa formula nella cella D2 per selezionare casualmente un valore dal set di dati originale.
Possiamo quindi trascinare questa formula a destra di 10 celle per generare il nostro primo campione di bootstrap.
Possiamo quindi trascinare questa formula su 300 righe per creare 300 campioni bootstrap:
Nota : Bootstrap utilizza il campionamento con sostituzione , il che significa che un valore del set di dati originale può apparire più volte in un dato campione.
Passaggio 3: calcolare la statistica di interesse per ciascun campione
Quindi possiamo calcolare la statistica di interesse per ciascun campione.
Ad esempio, potremmo calcolare la media, la mediana, la deviazione standard, l’intervallo interquartile, ecc. per ciascun campione.
Per questo esempio particolare, calcoleremo il valore mediano per ciascun campione:
Possiamo vedere:
- Il primo campione di bootstrap ha un valore medio di 14 .
- Il secondo campione di bootstrap ha un valore medio di 16 .
- Il terzo campione di bootstrap ha un valore medio di 13,5 .
E così via.
Passaggio 4: calcolare l’intervallo di confidenza del bootstrap
Infine, possiamo calcolare un intervallo di confidenza bootstrap del 95% per la mediana trovando il valore al percentile del 2,5% e al percentile del 97,5% nella colonna N.
Per fare ciò possiamo utilizzare le seguenti formule:
=PERCENTILE( N2:N301 , 0.025) =PERCENTILE( N2:N301 , 0.975)
La schermata seguente mostra come utilizzare queste formule nella pratica:
Dal risultato, possiamo vedere che l’intervallo di confidenza bootstrap del 95% per il valore mediano del set di dati originale è [10,475, 19,7625] .
Tieni presente che in questo esempio scegliamo di generare 300 campioni sottoposti a bootstrap, ciascuno con una dimensione del campione di n=10, ma puoi generare tutti i campioni sottoposti a bootstrap che desideri.
Quando si utilizza un software statistico, è normale generare campioni bootstrap che possono quindi essere utilizzati per costruire un intervallo di confidenza.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in Excel:
Come calcolare gli intervalli di confidenza in Excel
Come calcolare gli intervalli di previsione in Excel
Come calcolare gli intervalli di tolleranza in Excel