So berechnen sie einen bootstrap-standardfehler in r
Bootstrapping ist eine Methode, mit der der Standardfehler eines Mittelwerts geschätzt werden kann.
Der grundlegende Prozess zur Berechnung eines Bootstrapping-Standardfehlers ist wie folgt:
- Nehmen Sie k Replikatproben mit Ersetzung aus einem bestimmten Datensatz.
- Berechnen Sie für jede Stichprobe den Standardfehler: s/√ n
- Dies führt zu k unterschiedlichen Schätzungen des Standardfehlers. Um den Bootstrapping-Standardfehler zu ermitteln, nehmen Sie den Durchschnitt der k Standardfehler.
Die folgenden Beispiele erläutern zwei verschiedene Methoden, mit denen sich ein Bootstrapping-Standardfehler in R berechnen lässt.
Methode 1: Verwenden Sie das Starterpaket
Eine Möglichkeit, einen Boot-Standardfehler in R zu berechnen, besteht darin, die Funktion boot() aus der Boot- Bibliothek zu verwenden.
Der folgende Code zeigt, wie ein Bootstrap-Standardfehler für einen bestimmten Datensatz in R berechnet wird:
#make this example reproducible set. seeds (10) #load boot library library (boot) #define dataset x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35) #define function to calculate mean meanFunc <- function (x,i){mean(x[i])} #calculate standard error using 100 bootstrapped samples boot(x, meanFunc, 100) Bootstrap Statistics: original bias std. error t1* 21.5 0.254 2.379263
Der „ursprüngliche“ Wert von 21,5 zeigt den Durchschnitt des Originaldatensatzes. Die „std. Der Wert 2,379263 gibt den Bootstrap-Standardfehler des Mittelwerts an.
Beachten Sie, dass wir in diesem Beispiel 100 Bootstrapping-Stichproben verwendet haben, um den Standardfehler des Mittelwerts zu schätzen. Wir hätten aber auch 1.000 oder 10.000 oder eine beliebige Anzahl von Bootstrapping-Stichproben verwenden können.
Methode 2: Schreiben Sie Ihre eigene Formel
Eine andere Möglichkeit, einen Bootstrapping-Standardfehler zu berechnen, besteht darin, eine eigene Funktion zu schreiben.
Der folgende Code zeigt, wie das geht:
#make this example reproducible set. seeds (10) #load boot library library (boot) #define dataset x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35) mean(replicate(100, sd( sample (x, replace= T ))/sqrt( length (x)))) [1] 2.497414
Der Bootstrapping-Standardfehler beträgt 2,497414 .
Beachten Sie, dass dieser Standardfehler dem im vorherigen Beispiel berechneten ziemlich ähnlich ist.