Comment calculer une erreur standard de bootstrap dans R



Le bootstrapping est une méthode qui peut être utilisée pour estimer l’erreur type d’une moyenne.

Le processus de base pour calculer une erreur type bootstrapée est le suivant :

  • Prenez k échantillons répétés avec remplacement à partir d’un ensemble de données donné.
  • Pour chaque échantillon, calculez l’erreur type : s/√ n
  • Cela se traduit par k estimations différentes de l’erreur type. Pour trouver l’erreur standard bootstrapée, prenez la moyenne des k erreurs standard.

Les exemples suivants expliquent deux méthodes différentes qui peuvent être utilisées pour calculer une erreur standard bootstrapée dans R.

Méthode 1 : utiliser le package de démarrage

Une façon de calculer une erreur standard d’amorçage dans R consiste à utiliser la fonction boot() de la bibliothèque de démarrage .

Le code suivant montre comment calculer une erreur standard d’amorçage pour un ensemble de données donné dans R :

#make this example reproducible
set.seed(10)

#load boot library
library(boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

#define function to calculate mean
meanFunc <- function(x,i){mean(x[i])}

#calculate standard error using 100 bootstrapped samples
boot(x, meanFunc, 100)

Bootstrap Statistics :
    original  bias    std. error
t1*     21.5   0.254    2.379263

La valeur « originale » de 21,5 montre la moyenne de l’ensemble de données d’origine. Le « std. La valeur de 2,379263 indique l’erreur standard bootstrap de la moyenne.

Notez que nous avons utilisé 100 échantillons bootstrapés pour estimer l’erreur type de la moyenne dans cet exemple, mais nous aurions pu utiliser 1 000 ou 10 000 ou n’importe quel nombre d’échantillons bootstrapés que nous souhaitions.

Méthode 2 : écrivez votre propre formule

Une autre façon de calculer une erreur standard bootstrapée consiste à écrire notre propre fonction.

Le code suivant montre comment procéder :

#make this example reproducible
set.seed(10)

#load boot library
library(boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

mean(replicate(100, sd(sample(x, replace=T))/sqrt(length(x))))

[1] 2.497414

L’erreur standard bootstrapée s’avère être 2,497414 .

Notez que cette erreur type est assez similaire à celle calculée dans l’exemple précédent.

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *