Comment calculer une erreur standard de bootstrap dans R
Le bootstrapping est une méthode qui peut être utilisée pour estimer l’erreur type d’une moyenne.
Le processus de base pour calculer une erreur type bootstrapée est le suivant :
- Prenez k échantillons répétés avec remplacement à partir d’un ensemble de données donné.
- Pour chaque échantillon, calculez l’erreur type : s/√ n
- Cela se traduit par k estimations différentes de l’erreur type. Pour trouver l’erreur standard bootstrapée, prenez la moyenne des k erreurs standard.
Les exemples suivants expliquent deux méthodes différentes qui peuvent être utilisées pour calculer une erreur standard bootstrapée dans R.
Méthode 1 : utiliser le package de démarrage
Une façon de calculer une erreur standard d’amorçage dans R consiste à utiliser la fonction boot() de la bibliothèque de démarrage .
Le code suivant montre comment calculer une erreur standard d’amorçage pour un ensemble de données donné dans R :
#make this example reproducible set.seed(10) #load boot library library(boot) #define dataset x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35) #define function to calculate mean meanFunc <- function(x,i){mean(x[i])} #calculate standard error using 100 bootstrapped samples boot(x, meanFunc, 100) Bootstrap Statistics : original bias std. error t1* 21.5 0.254 2.379263
La valeur « originale » de 21,5 montre la moyenne de l’ensemble de données d’origine. Le « std. La valeur de 2,379263 indique l’erreur standard bootstrap de la moyenne.
Notez que nous avons utilisé 100 échantillons bootstrapés pour estimer l’erreur type de la moyenne dans cet exemple, mais nous aurions pu utiliser 1 000 ou 10 000 ou n’importe quel nombre d’échantillons bootstrapés que nous souhaitions.
Méthode 2 : écrivez votre propre formule
Une autre façon de calculer une erreur standard bootstrapée consiste à écrire notre propre fonction.
Le code suivant montre comment procéder :
#make this example reproducible set.seed(10) #load boot library library(boot) #define dataset x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35) mean(replicate(100, sd(sample(x, replace=T))/sqrt(length(x)))) [1] 2.497414
L’erreur standard bootstrapée s’avère être 2,497414 .
Notez que cette erreur type est assez similaire à celle calculée dans l’exemple précédent.