Hoe te bootstrapping in excel (met voorbeeld)


Bootstrapping is een methode die kan worden gebruikt om een betrouwbaarheidsinterval voor een statistiek te construeren wanneer de steekproefomvang klein is en de onderliggende verdeling onbekend is.

Het basisproces voor bootstrapping is als volgt:

  • Neem k replicaatmonsters met vervanging uit een gegeven dataset.
  • Bereken voor elk monster de betreffende statistiek.
  • Dit levert k verschillende schattingen op voor een bepaalde statistiek, die u vervolgens kunt gebruiken om een betrouwbaarheidsinterval voor de statistiek te berekenen.

Het volgende stapsgewijze voorbeeld laat zien hoe u kunt opstarten in Excel.

Stap 1: Voer de originele gegevens in

Eerst voeren we waarden uit een dataset in:

Stap 2: Genereer bootstrap-voorbeelden

Vervolgens zullen we de volgende formule gebruiken om bootstrap-voorbeelden te genereren:

 =INDEX( $A$2:$A$16 , RANDBETWEEN(1, ROWS( $A$2:$A$16 )),1)

We kunnen deze formule in cel D2 typen om willekeurig een waarde uit de originele gegevensset te selecteren.

We kunnen deze formule vervolgens 10 cellen naar rechts slepen om ons eerste bootstrap-voorbeeld te genereren.

We kunnen deze formule vervolgens over 300 rijen slepen om 300 bootstrapped samples te maken:

bootstrap in Excel

Opmerking : Bootstrap gebruikt sampling with replacement , wat betekent dat een waarde uit de originele gegevensset meerdere keren in een gegeven voorbeeld kan voorkomen.

Stap 3: Bereken de relevante statistiek voor elk monster

Vervolgens kunnen we voor elk monster de relevante statistiek berekenen.

We kunnen bijvoorbeeld het gemiddelde, de mediaan, de standaarddeviatie, het interkwartielbereik, enz. berekenen. voor elk monster.

Voor dit specifieke voorbeeld berekenen we de mediaanwaarde voor elk monster:

Wij kunnen zien:

  • Het eerste bootstrap-voorbeeld heeft een mediaanwaarde van 14 .
  • Het tweede bootstrap-monster heeft een mediaanwaarde van 16 .
  • Het derde bootstrap-monster heeft een mediaanwaarde van 13,5 .

Enzovoort.

Stap 4: Bereken het bootstrap-betrouwbaarheidsinterval

Ten slotte kunnen we een bootstrap-betrouwbaarheidsinterval van 95% voor de mediaan berekenen door de waarde op het 2,5%-percentiel en het 97,5%-percentiel in kolom N te vinden.

Om dit te doen, kunnen we de volgende formules gebruiken:

 =PERCENTILE( N2:N301 , 0.025)

=PERCENTILE( N2:N301 , 0.975)

De volgende schermafbeelding laat zien hoe u deze formules in de praktijk kunt gebruiken:

bootstrap-betrouwbaarheidsinterval in Excel

Uit het resultaat kunnen we zien dat het 95% bootstrap-betrouwbaarheidsinterval voor de mediaanwaarde van de oorspronkelijke gegevensset [10.475, 19.7625] is.

Houd er rekening mee dat we er in dit voorbeeld voor kiezen om 300 bootstrap-voorbeelden te genereren, elk met een steekproefomvang van n=10, maar u kunt zoveel bootstrap-voorbeelden genereren als u wilt.

Bij het gebruik van statistische software is het gebruikelijk om bootstrapped steekproeven te genereren die vervolgens kunnen worden gebruikt om een betrouwbaarheidsinterval te construeren.

Aanvullende bronnen

In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in Excel kunt uitvoeren:

Hoe betrouwbaarheidsintervallen in Excel te berekenen
Hoe voorspellingsintervallen in Excel te berekenen
Hoe tolerantie-intervallen in Excel te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert