Como inicializar no excel (com exemplo)


Bootstrapping é um método que pode ser usado para construir um intervalo de confiança para uma estatística quando o tamanho da amostra é pequeno e a distribuição subjacente é desconhecida.

O processo básico para inicialização é o seguinte:

  • Pegue k amostras replicadas com substituição de um determinado conjunto de dados.
  • Para cada amostra, calcule a estatística de interesse.
  • Isso fornece k estimativas diferentes para uma determinada estatística, que você pode usar para calcular um intervalo de confiança para a estatística.

O exemplo passo a passo a seguir mostra como inicializar no Excel.

Etapa 1: insira os dados originais

Primeiro, inseriremos valores de um conjunto de dados:

Etapa 2: gerar exemplos de bootstrap

A seguir, usaremos a seguinte fórmula para gerar exemplos de bootstrap:

 =INDEX( $A$2:$A$16 , RANDBETWEEN(1, ROWS( $A$2:$A$16 )),1)

Podemos digitar esta fórmula na célula D2 para selecionar aleatoriamente um valor do conjunto de dados original.

Podemos então arrastar esta fórmula 10 células para a direita para gerar nossa primeira amostra de bootstrap.

Podemos então arrastar esta fórmula por mais de 300 linhas para criar 300 amostras inicializadas:

inicialização no Excel

Nota : Bootstrap usa amostragem com substituição , o que significa que um valor do conjunto de dados original pode aparecer várias vezes em uma determinada amostra.

Etapa 3: Calcule a estatística de interesse para cada amostra

Então podemos calcular a estatística de interesse para cada amostra.

Por exemplo, poderíamos calcular a média, mediana, desvio padrão, intervalo interquartil, etc. para cada amostra.

Para este exemplo específico, calcularemos o valor mediano para cada amostra:

Nós podemos ver:

  • A primeira amostra de bootstrap tem um valor mediano de 14 .
  • A segunda amostra de bootstrap tem um valor mediano de 16 .
  • A terceira amostra de bootstrap tem um valor mediano de 13,5 .

E assim por diante.

Etapa 4: Calcule o intervalo de confiança de bootstrap

Finalmente, podemos calcular um intervalo de confiança de bootstrap de 95% para a mediana, encontrando o valor no percentil 2,5% e no percentil 97,5% na coluna N.

Para fazer isso, podemos usar as seguintes fórmulas:

 =PERCENTILE( N2:N301 , 0.025)

=PERCENTILE( N2:N301 , 0.975)

A captura de tela a seguir mostra como usar essas fórmulas na prática:

intervalo de confiança de inicialização no Excel

A partir do resultado, podemos ver que o intervalo de confiança de bootstrap de 95% para o valor mediano do conjunto de dados original é [10.475, 19.7625] .

Observe que neste exemplo optamos por gerar 300 amostras inicializadas, cada uma com um tamanho de amostra de n=10, mas você pode gerar quantas amostras inicializadas desejar.

Ao usar software estatístico, é comum gerar amostras bootstrap que podem então ser usadas para construir um intervalo de confiança.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns no Excel:

Como calcular intervalos de confiança no Excel
Como calcular intervalos de previsão no Excel
Como calcular intervalos de tolerância no Excel

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *