Como inicializar no excel (com exemplo)
Bootstrapping é um método que pode ser usado para construir um intervalo de confiança para uma estatística quando o tamanho da amostra é pequeno e a distribuição subjacente é desconhecida.
O processo básico para inicialização é o seguinte:
- Pegue k amostras replicadas com substituição de um determinado conjunto de dados.
- Para cada amostra, calcule a estatística de interesse.
- Isso fornece k estimativas diferentes para uma determinada estatística, que você pode usar para calcular um intervalo de confiança para a estatística.
O exemplo passo a passo a seguir mostra como inicializar no Excel.
Etapa 1: insira os dados originais
Primeiro, inseriremos valores de um conjunto de dados:
Etapa 2: gerar exemplos de bootstrap
A seguir, usaremos a seguinte fórmula para gerar exemplos de bootstrap:
=INDEX( $A$2:$A$16 , RANDBETWEEN(1, ROWS( $A$2:$A$16 )),1)
Podemos digitar esta fórmula na célula D2 para selecionar aleatoriamente um valor do conjunto de dados original.
Podemos então arrastar esta fórmula 10 células para a direita para gerar nossa primeira amostra de bootstrap.
Podemos então arrastar esta fórmula por mais de 300 linhas para criar 300 amostras inicializadas:
Nota : Bootstrap usa amostragem com substituição , o que significa que um valor do conjunto de dados original pode aparecer várias vezes em uma determinada amostra.
Etapa 3: Calcule a estatística de interesse para cada amostra
Então podemos calcular a estatística de interesse para cada amostra.
Por exemplo, poderíamos calcular a média, mediana, desvio padrão, intervalo interquartil, etc. para cada amostra.
Para este exemplo específico, calcularemos o valor mediano para cada amostra:
Nós podemos ver:
- A primeira amostra de bootstrap tem um valor mediano de 14 .
- A segunda amostra de bootstrap tem um valor mediano de 16 .
- A terceira amostra de bootstrap tem um valor mediano de 13,5 .
E assim por diante.
Etapa 4: Calcule o intervalo de confiança de bootstrap
Finalmente, podemos calcular um intervalo de confiança de bootstrap de 95% para a mediana, encontrando o valor no percentil 2,5% e no percentil 97,5% na coluna N.
Para fazer isso, podemos usar as seguintes fórmulas:
=PERCENTILE( N2:N301 , 0.025) =PERCENTILE( N2:N301 , 0.975)
A captura de tela a seguir mostra como usar essas fórmulas na prática:
A partir do resultado, podemos ver que o intervalo de confiança de bootstrap de 95% para o valor mediano do conjunto de dados original é [10.475, 19.7625] .
Observe que neste exemplo optamos por gerar 300 amostras inicializadas, cada uma com um tamanho de amostra de n=10, mas você pode gerar quantas amostras inicializadas desejar.
Ao usar software estatístico, é comum gerar amostras bootstrap que podem então ser usadas para construir um intervalo de confiança.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns no Excel:
Como calcular intervalos de confiança no Excel
Como calcular intervalos de previsão no Excel
Como calcular intervalos de tolerância no Excel