Jak obliczyć błąd standardowy bootstrap w r


Bootstrapping to metoda, którą można zastosować do oszacowania błędu standardowego średniej.

Podstawowy proces obliczania błędu standardowego z metodą ładowania początkowego jest następujący:

  • Pobierz k powtórzonych próbek z zamianą z danego zbioru danych.
  • Dla każdej próbki oblicz błąd standardowy: s/√ n
  • Daje to k różnych szacunków błędu standardowego. Aby znaleźć błąd standardowy z metodą ładowania początkowego, należy przyjąć średnią z k błędów standardowych.

Poniższe przykłady wyjaśniają dwie różne metody, których można użyć do obliczenia błędu standardowego z ładowaniem początkowym w R.

Metoda 1: Skorzystaj z Pakietu Startowego

Jednym ze sposobów obliczenia standardowego błędu rozruchu w R jest użycie funkcji boot() z biblioteki startowej .

Poniższy kod pokazuje, jak obliczyć standardowy błąd ładowania początkowego dla danego zestawu danych w R:

 #make this example reproducible
set. seeds (10)

#load boot library
library (boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

#define function to calculate mean
meanFunc <- function (x,i){mean(x[i])}

#calculate standard error using 100 bootstrapped samples
boot(x, meanFunc, 100)

Bootstrap Statistics:
    original bias std. error
t1* 21.5 0.254 2.379263

„Oryginalna” wartość 21,5 pokazuje średnią z oryginalnego zbioru danych. Opcja „std. Wartość 2,379263 wskazuje błąd standardowy średniej metody bootstrap.

Należy zauważyć, że w tym przykładzie użyliśmy 100 próbek ładowanych metodą ładowania początkowego do oszacowania błędu standardowego średniej, ale mogliśmy użyć 1000 lub 10 000 lub dowolnej liczby próbek ładowanych metodą ładowania początkowego.

Metoda 2: Napisz własną formułę

Innym sposobem obliczenia błędu standardowego metodą ładowania początkowego jest napisanie własnej funkcji.

Poniższy kod pokazuje, jak to zrobić:

 #make this example reproducible
set. seeds (10)

#load boot library
library (boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

mean(replicate(100, sd( sample (x, replace= T ))/sqrt( length (x))))

[1] 2.497414

Standardowy błąd ładowania początkowego wynosi 2.497414 .

Należy zauważyć, że ten błąd standardowy jest dość podobny do błędu obliczonego w poprzednim przykładzie.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *