Jak obliczyć błąd standardowy bootstrap w r
Bootstrapping to metoda, którą można zastosować do oszacowania błędu standardowego średniej.
Podstawowy proces obliczania błędu standardowego z metodą ładowania początkowego jest następujący:
- Pobierz k powtórzonych próbek z zamianą z danego zbioru danych.
- Dla każdej próbki oblicz błąd standardowy: s/√ n
- Daje to k różnych szacunków błędu standardowego. Aby znaleźć błąd standardowy z metodą ładowania początkowego, należy przyjąć średnią z k błędów standardowych.
Poniższe przykłady wyjaśniają dwie różne metody, których można użyć do obliczenia błędu standardowego z ładowaniem początkowym w R.
Metoda 1: Skorzystaj z Pakietu Startowego
Jednym ze sposobów obliczenia standardowego błędu rozruchu w R jest użycie funkcji boot() z biblioteki startowej .
Poniższy kod pokazuje, jak obliczyć standardowy błąd ładowania początkowego dla danego zestawu danych w R:
#make this example reproducible set. seeds (10) #load boot library library (boot) #define dataset x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35) #define function to calculate mean meanFunc <- function (x,i){mean(x[i])} #calculate standard error using 100 bootstrapped samples boot(x, meanFunc, 100) Bootstrap Statistics: original bias std. error t1* 21.5 0.254 2.379263
„Oryginalna” wartość 21,5 pokazuje średnią z oryginalnego zbioru danych. Opcja „std. Wartość 2,379263 wskazuje błąd standardowy średniej metody bootstrap.
Należy zauważyć, że w tym przykładzie użyliśmy 100 próbek ładowanych metodą ładowania początkowego do oszacowania błędu standardowego średniej, ale mogliśmy użyć 1000 lub 10 000 lub dowolnej liczby próbek ładowanych metodą ładowania początkowego.
Metoda 2: Napisz własną formułę
Innym sposobem obliczenia błędu standardowego metodą ładowania początkowego jest napisanie własnej funkcji.
Poniższy kod pokazuje, jak to zrobić:
#make this example reproducible set. seeds (10) #load boot library library (boot) #define dataset x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35) mean(replicate(100, sd( sample (x, replace= T ))/sqrt( length (x)))) [1] 2.497414
Standardowy błąd ładowania początkowego wynosi 2.497414 .
Należy zauważyć, że ten błąd standardowy jest dość podobny do błędu obliczonego w poprzednim przykładzie.