Jak bootstrapping w excelu (z przykładem)
Metoda ładowania początkowego to metoda, którą można zastosować do skonstruowania przedziału ufności dla statystyki , gdy wielkość próby jest mała, a rozkład leżący u jej podstaw jest nieznany.
Podstawowy proces ładowania początkowego jest następujący:
- Pobierz k powtórzonych próbek z zamianą z danego zbioru danych.
- Dla każdej próbki oblicz interesującą statystykę.
- Daje to k różnych szacunków dla danej statystyki, które można następnie wykorzystać do obliczenia przedziału ufności dla tej statystyki.
Poniższy przykład krok po kroku pokazuje, jak wykonać bootstrap w programie Excel.
Krok 1: Wprowadź oryginalne dane
Najpierw wprowadzimy wartości ze zbioru danych:
Krok 2: Wygeneruj przykłady bootstrap
Następnie użyjemy poniższej formuły do wygenerowania przykładów bootstrap:
=INDEX( $A$2:$A$16 , RANDBETWEEN(1, ROWS( $A$2:$A$16 )),1)
Możemy wpisać tę formułę w komórce D2 , aby losowo wybrać wartość z oryginalnego zestawu danych.
Następnie możemy przeciągnąć tę formułę o 10 komórek w prawo, aby wygenerować pierwszą próbkę bootstrap.
Następnie możemy przeciągnąć tę formułę na 300 wierszy, aby utworzyć 300 próbek ładowanych metodą ładowania początkowego:
Uwaga : Bootstrap wykorzystuje próbkowanie z zamianą , co oznacza, że wartość z oryginalnego zbioru danych może pojawić się wielokrotnie w danej próbce.
Krok 3: Oblicz interesującą statystykę dla każdej próbki
Następnie możemy obliczyć interesującą statystykę dla każdej próbki.
Na przykład możemy obliczyć średnią, medianę, odchylenie standardowe, rozstęp międzykwartylowy itp. dla każdej próbki.
W tym konkretnym przykładzie obliczymy wartość mediany dla każdej próbki:
Możemy zobaczyć:
- Pierwsza próbka bootstrap ma medianę wartości 14 .
- Druga próbka bootstrap ma medianę wartości 16 .
- Trzecia próbka bootstrap ma medianę wartości 13,5 .
I tak dalej.
Krok 4: Oblicz przedział ufności bootstrap
Na koniec możemy obliczyć 95% przedział ufności bootstrap dla mediany, znajdując wartość w percentylu 2,5% i percentylu 97,5% w kolumnie N.
W tym celu możemy skorzystać z następujących formuł:
=PERCENTILE( N2:N301 , 0.025) =PERCENTILE( N2:N301 , 0.975)
Poniższy zrzut ekranu pokazuje, jak w praktyce korzystać z tych formuł:
Z wyniku widzimy, że 95% przedział ufności metody bootstrap dla mediany wartości oryginalnego zbioru danych wynosi [10,475, 19,7625] .
Zauważ, że w tym przykładzie zdecydowaliśmy się wygenerować 300 próbek ładowanych metodą ładowania początkowego, każda o wielkości próbki n=10, ale możesz wygenerować dowolną liczbę próbek ładowanych metodą ładowania początkowego.
Podczas korzystania z oprogramowania statystycznego często generuje się próbki bootstrap, które można następnie wykorzystać do skonstruowania przedziału ufności.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w programie Excel:
Jak obliczyć przedziały ufności w programie Excel
Jak obliczyć odstępy prognoz w programie Excel
Jak obliczyć przedziały tolerancji w programie Excel