So führen sie bootstrapping in excel durch (mit beispiel)
Bootstrapping ist eine Methode, mit der ein Konfidenzintervall für eine Statistik erstellt werden kann, wenn die Stichprobengröße klein und die zugrunde liegende Verteilung unbekannt ist.
Der grundlegende Prozess für das Bootstrapping ist wie folgt:
- Nehmen Sie k Replikatproben mit Ersetzung aus einem bestimmten Datensatz.
- Berechnen Sie für jede Stichprobe die interessierende Statistik.
- Dies ergibt k verschiedene Schätzungen für eine bestimmte Statistik, die Sie dann zur Berechnung eines Konfidenzintervalls für die Statistik verwenden können.
Das folgende Schritt-für-Schritt-Beispiel zeigt, wie ein Bootstrap in Excel durchgeführt wird.
Schritt 1: Geben Sie die Originaldaten ein
Zuerst geben wir Werte aus einem Datensatz ein:
Schritt 2: Bootstrap-Beispiele generieren
Als Nächstes verwenden wir die folgende Formel, um Bootstrap-Beispiele zu generieren:
=INDEX( $A$2:$A$16 , RANDBETWEEN(1, ROWS( $A$2:$A$16 )),1)
Wir können diese Formel in Zelle D2 eingeben, um zufällig einen Wert aus dem Originaldatensatz auszuwählen.
Anschließend können wir diese Formel um 10 Zellen nach rechts ziehen, um unser erstes Bootstrap-Beispiel zu generieren.
Anschließend können wir diese Formel über 300 Zeilen ziehen, um 300 Bootstrapping-Beispiele zu erstellen:
Hinweis : Bootstrap verwendet Sampling mit Ersetzung , was bedeutet, dass ein Wert aus dem Originaldatensatz in einer bestimmten Stichprobe mehrmals vorkommen kann.
Schritt 3: Berechnen Sie die interessierende Statistik für jede Stichprobe
Dann können wir die interessierende Statistik für jede Stichprobe berechnen.
Wir könnten zum Beispiel den Mittelwert, den Median, die Standardabweichung, den Interquartilbereich usw. berechnen. für jede Probe.
Für dieses spezielle Beispiel berechnen wir den Medianwert für jede Stichprobe:
Wir sehen:
- Die erste Bootstrap-Stichprobe hat einen Medianwert von 14 .
- Die zweite Bootstrap-Stichprobe hat einen Medianwert von 16 .
- Die dritte Bootstrap-Stichprobe hat einen Medianwert von 13,5 .
Und so weiter.
Schritt 4: Berechnen Sie das Bootstrap-Konfidenzintervall
Schließlich können wir ein 95 %-Bootstrap-Konfidenzintervall für den Median berechnen, indem wir den Wert beim 2,5 %-Perzentil und beim 97,5 %-Perzentil in Spalte N ermitteln.
Dazu können wir die folgenden Formeln verwenden:
=PERCENTILE( N2:N301 , 0.025) =PERCENTILE( N2:N301 , 0.975)
Der folgende Screenshot zeigt, wie diese Formeln in der Praxis angewendet werden:
Aus dem Ergebnis können wir ersehen, dass das 95 %-Bootstrap-Konfidenzintervall für den Medianwert des Originaldatensatzes [10,475, 19,7625] beträgt.
Beachten Sie, dass wir uns in diesem Beispiel für die Generierung von 300 Bootstrap-Beispielen entscheiden, jedes mit einer Stichprobengröße von n=10, Sie können jedoch so viele Bootstrap-Beispiele generieren, wie Sie möchten.
Bei der Verwendung von Statistiksoftware ist es üblich, Bootstrapping-Stichproben zu generieren, die dann zur Erstellung eines Konfidenzintervalls verwendet werden können.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erklärt, wie Sie andere häufige Aufgaben in Excel ausführen:
So berechnen Sie Konfidenzintervalle in Excel
So berechnen Sie Vorhersageintervalle in Excel
So berechnen Sie Toleranzintervalle in Excel