Stichprobenverteilung
In diesem Artikel wird erklärt, was Stichprobenverteilung in der Statistik ist und wofür sie verwendet wird. So finden Sie die Bedeutung einer Stichprobenverteilung, ein konkretes Beispiel einer Stichprobenverteilung und darüber hinaus die Formeln für die gängigsten Arten von Stichprobenverteilungen.
Wie ist die Stichprobenverteilung?
Die Stichprobenverteilung oder Stichprobenverteilung ist die Verteilung, die sich aus der Berücksichtigung aller möglichen Stichproben aus einer Grundgesamtheit ergibt. Mit anderen Worten: Die Stichprobenverteilung ist die Verteilung, die man durch die Berechnung eines Stichprobenparameters aller möglichen Stichproben aus einer Grundgesamtheit erhält.
Wenn wir beispielsweise alle möglichen Stichproben aus einer statistischen Grundgesamtheit extrahieren und den Mittelwert jeder Stichprobe berechnen, bildet die Menge der Stichprobenmittelwerte eine Stichprobenverteilung. Genauer gesagt, da der berechnete Parameter das arithmetische Mittel ist, handelt es sich um die Stichprobenverteilung des Mittelwerts.
In der Statistik wird die Stichprobenverteilung verwendet, um die Wahrscheinlichkeit zu berechnen, dass man sich bei der Untersuchung einer einzelnen Stichprobe dem Wert des Grundgesamtheitsparameters annähert. In ähnlicher Weise ermöglicht uns die Stichprobenverteilung, den Stichprobenfehler für eine gegebene Stichprobengröße abzuschätzen.
Beispiel für eine Stichprobenverteilung
Nachdem wir nun die Definition der Stichprobenverteilung kennen, schauen wir uns ein einfaches Beispiel an, um das Konzept vollständig zu verstehen.
- In eine Schachtel legen wir drei Kugeln und auf jede Kugel ist eine Zahl von eins bis drei geschrieben, so dass eine Kugel die Zahl 1, eine andere Kugel die Zahl 2 und die letzte Kugel die Zahl 3 hat. Für eine Stichprobe der Größe n = 2 berechnet die Wahrscheinlichkeiten der Stichprobenverteilung des Mittelwerts, wenn Stichproben mit Ersetzung ausgewählt werden.
Die Proben werden mit Ersatz ausgewählt, das heißt, die zur Auswahl des ersten Elements der Probe aufgenommene Kugel wird in die Box zurückgelegt und kann bei der zweiten Extraktion erneut ausgewählt werden. Daher sind alle möglichen Stichproben aus der Bevölkerung:
1.1 1.2 1.3
2.1 2.2 2.3
3.1 3.2 3.3
Daher berechnen wir das arithmetische Mittel jeder möglichen Stichprobe:
Daher sind die Wahrscheinlichkeiten, jeden Wert des Stichprobenmittelwerts zu erhalten, wenn eine Zufallsstichprobe aus der Grundgesamtheit ausgewählt wird, wie folgt:
Die Wahrscheinlichkeiten der in der Tabelle oben gezeigten Stichprobenverteilung wurden berechnet, indem die Anzahl der Stichproben mit diesem Mittelwert durch die Gesamtzahl der möglichen Fälle dividiert wurde. Beispiel: Der Stichprobenmittelwert beträgt in zwei von neun möglichen Fällen 1,5, daher ist P(1,5)=2/9.
Arten von Stichprobenverteilungen
Stichprobenverteilungen (oder Stichprobenverteilungen) können basierend auf dem Stichprobenparameter, aus dem sie ermittelt wurden, klassifiziert werden. Die häufigsten Verteilungsarten sind also die folgenden:
- Stichprobenverteilung des Mittelwerts : Dies ist die Stichprobenverteilung, die sich aus der Berechnung des arithmetischen Mittels jeder Stichprobe ergibt.
- Proportionale Stichprobenverteilung : Hierbei handelt es sich um die Stichprobenverteilung, die durch Berechnen des Anteils aller Stichproben ermittelt wird.
- Stichprobenvarianzverteilung : Dies ist die Stichprobenverteilung, die die Menge aller Varianzen in der Stichprobe bildet.
- Differenz der Mittelwerte der Stichprobenverteilung : ist die Stichprobenverteilung, die sich aus der Berechnung der Differenz zwischen den Mittelwerten aller möglichen Stichproben aus zwei verschiedenen Grundgesamtheiten ergibt.
- Differenz in den Proportionen der Stichprobenverteilung : ist die Stichprobenverteilung, die durch Subtrahieren aller möglichen Stichprobenanteile von zwei Grundgesamtheiten erhalten wird.
Die einzelnen Arten der Stichprobenverteilung werden im Folgenden ausführlicher erläutert.
Stichprobenverteilung des Mittelwerts
Gegeben sei eine Grundgesamtheit, die einer normalen Wahrscheinlichkeitsverteilung mit Mittelwert folgt
und Standardabweichung
und Größenproben werden extrahiert
, wird die Stichprobenverteilung des Mittelwerts auch durch eine Normalverteilung mit den folgenden Merkmalen definiert:
Gold
ist der Mittelwert der Stichprobenverteilung des Mittelwerts und
ist seine Standardabweichung. Außerdem,
ist der Standardfehler der Stichprobenverteilung.
Hinweis: Wenn die Grundgesamtheit keiner Normalverteilung folgt, aber die Stichprobengröße groß ist (n>30), kann die Stichprobenverteilung des Mittelwerts auch durch die Grenze des zentralen Theorems an die obige Normalverteilung angenähert werden.
Da die Stichprobenverteilung des Mittelwerts einer Normalverteilung folgt, lautet die Formel zur Berechnung aller Wahrscheinlichkeiten im Zusammenhang mit dem Stichprobenmittelwert :
Gold:
-
ist das Beispielmittel.
-
Dies ist der Bevölkerungsdurchschnitt.
-
ist die Populationsstandardabweichung.
-
ist die Stichprobengröße.
-
ist eine durch die Standardnormalverteilung N(0,1) definierte Variable.
Stichprobenverteilung des Anteils
Wenn wir einen Teil einer Stichprobe untersuchen, analysieren wir tatsächlich Erfolgsfälle. Daher folgt die Zufallsvariable in der Studie einer binomialen Wahrscheinlichkeitsverteilung.
Nach dem zentralen Grenzwertsatz können wir für große Größen (n>30) eine Binomialverteilung näher an eine Normalverteilung bringen. Daher nähert sich die Stichprobenverteilung des Anteils einer Normalverteilung mit den folgenden Parametern an:
Gold
ist die Erfolgswahrscheinlichkeit und
ist die Wahrscheinlichkeit des Scheiterns
.
Hinweis: Eine Binomialverteilung kann nur dann einer Normalverteilung angenähert werden, wenn
Und
.
Da die Stichprobenverteilung des Anteils einer Normalverteilung angenähert werden kann, lautet die Formel zur Berechnung einer Wahrscheinlichkeit im Zusammenhang mit dem Anteil einer Stichprobe daher:
Gold:
-
ist der Stichprobenanteil.
-
ist der Anteil der Bevölkerung.
-
ist die Ausfallwahrscheinlichkeit der Bevölkerung,
.
-
ist die Stichprobengröße.
-
ist eine durch die Standardnormalverteilung N(0,1) definierte Variable.
Stichprobenverteilung der Varianz
Die Stichprobenvarianzverteilung wird durch die Chi-Quadrat-Wahrscheinlichkeitsverteilung definiert. Daher lautet die Formel für die Statistik der Stichprobenvarianzverteilung :
Gold:
-
ist die Statistik der Stichprobenvarianzverteilung, die einer Chi-Quadrat-Verteilung folgt.
-
ist die Stichprobengröße.
-
ist die Stichprobenvarianz.
-
ist die Populationsvarianz.
Stichprobenverteilung der Mittelwertdifferenz
Wenn die Stichprobengröße groß genug ist (n 1 ≥ 30 und n 2 ≥ 30), folgt die Stichprobenverteilung der Mittelwertdifferenz einer Normalverteilung. Genauer gesagt werden die Parameter dieser Verteilung wie folgt berechnet:
Hinweis: Wenn es sich bei beiden Grundgesamtheiten um Normalverteilungen handelt, folgt die Stichprobenverteilung der Mittelwertdifferenz unabhängig von der Stichprobengröße einer Normalverteilung.
Da die Stichprobenverteilung der Mittelwertdifferenz durch eine Normalverteilung definiert ist, lautet die Formel zur Berechnung der Statistik der Stichprobenverteilung der Mittelwertdifferenz daher:
Gold:
-
ist der Mittelwert der Stichprobe i.
-
ist der Mittelwert der Bevölkerung i.
-
ist die Standardabweichung der Grundgesamtheit i.
-
ist die Stichprobengröße i.
-
ist eine durch die Standardnormalverteilung N(0,1) definierte Variable.
Beachten Sie, dass Stichproben aus verschiedenen Populationen unterschiedliche Stichprobengrößen haben können.
Stichprobenverteilung der Differenz in den Proportionen
Die für die Stichprobenverteilung der unterschiedlichen Anteile ausgewählten Stichproben werden durch Binomialverteilungen definiert, da ein Anteil für praktische Zwecke ein Verhältnis von Erfolgsfällen zur Gesamtzahl der Beobachtungen ist.
Aufgrund des zentralen Grenzwertsatzes können Binomialverteilungen jedoch an normale Wahrscheinlichkeitsverteilungen angenähert werden. Daher kann die Stichprobenverteilung der Proportionsdifferenz einer Normalverteilung mit den folgenden Merkmalen angenähert werden:
Hinweis: Die Stichprobenverteilung der Proportionsdifferenz kann nur dann einer Normalverteilung angenähert werden, wenn
,
,
,
,
Und
.
Da die Stichprobenverteilung der Proportionsdifferenz einer Normalverteilung angenähert werden kann, lautet die Formel zur Berechnung der Statistik der Stichprobenverteilung der Proportionsdifferenz wie folgt:
Gold:
-
ist der Stichprobenanteil i.
-
ist der Anteil der Bevölkerung i.
-
ist die Ausfallwahrscheinlichkeit der Population i,
.
-
ist die Stichprobengröße i.
-
ist eine durch die Standardnormalverteilung N(0,1) definierte Variable.