Jak bootstrapping w excelu (z przykładem)


Metoda ładowania początkowego to metoda, którą można zastosować do skonstruowania przedziału ufności dla statystyki , gdy wielkość próby jest mała, a rozkład leżący u jej podstaw jest nieznany.

Podstawowy proces ładowania początkowego jest następujący:

  • Pobierz k powtórzonych próbek z zamianą z danego zbioru danych.
  • Dla każdej próbki oblicz interesującą statystykę.
  • Daje to k różnych szacunków dla danej statystyki, które można następnie wykorzystać do obliczenia przedziału ufności dla tej statystyki.

Poniższy przykład krok po kroku pokazuje, jak wykonać bootstrap w programie Excel.

Krok 1: Wprowadź oryginalne dane

Najpierw wprowadzimy wartości ze zbioru danych:

Krok 2: Wygeneruj przykłady bootstrap

Następnie użyjemy poniższej formuły do wygenerowania przykładów bootstrap:

 =INDEX( $A$2:$A$16 , RANDBETWEEN(1, ROWS( $A$2:$A$16 )),1)

Możemy wpisać tę formułę w komórce D2 , aby losowo wybrać wartość z oryginalnego zestawu danych.

Następnie możemy przeciągnąć tę formułę o 10 komórek w prawo, aby wygenerować pierwszą próbkę bootstrap.

Następnie możemy przeciągnąć tę formułę na 300 wierszy, aby utworzyć 300 próbek ładowanych metodą ładowania początkowego:

bootstrap w Excelu

Uwaga : Bootstrap wykorzystuje próbkowanie z zamianą , co oznacza, że wartość z oryginalnego zbioru danych może pojawić się wielokrotnie w danej próbce.

Krok 3: Oblicz interesującą statystykę dla każdej próbki

Następnie możemy obliczyć interesującą statystykę dla każdej próbki.

Na przykład możemy obliczyć średnią, medianę, odchylenie standardowe, rozstęp międzykwartylowy itp. dla każdej próbki.

W tym konkretnym przykładzie obliczymy wartość mediany dla każdej próbki:

Możemy zobaczyć:

  • Pierwsza próbka bootstrap ma medianę wartości 14 .
  • Druga próbka bootstrap ma medianę wartości 16 .
  • Trzecia próbka bootstrap ma medianę wartości 13,5 .

I tak dalej.

Krok 4: Oblicz przedział ufności bootstrap

Na koniec możemy obliczyć 95% przedział ufności bootstrap dla mediany, znajdując wartość w percentylu 2,5% i percentylu 97,5% w kolumnie N.

W tym celu możemy skorzystać z następujących formuł:

 =PERCENTILE( N2:N301 , 0.025)

=PERCENTILE( N2:N301 , 0.975)

Poniższy zrzut ekranu pokazuje, jak w praktyce korzystać z tych formuł:

przedział ufności ładowania początkowego w programie Excel

Z wyniku widzimy, że 95% przedział ufności metody bootstrap dla mediany wartości oryginalnego zbioru danych wynosi [10,475, 19,7625] .

Zauważ, że w tym przykładzie zdecydowaliśmy się wygenerować 300 próbek ładowanych metodą ładowania początkowego, każda o wielkości próbki n=10, ale możesz wygenerować dowolną liczbę próbek ładowanych metodą ładowania początkowego.

Podczas korzystania z oprogramowania statystycznego często generuje się próbki bootstrap, które można następnie wykorzystać do skonstruowania przedziału ufności.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w programie Excel:

Jak obliczyć przedziały ufności w programie Excel
Jak obliczyć odstępy prognoz w programie Excel
Jak obliczyć przedziały tolerancji w programie Excel

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *