Anteil der stichprobe im verhältnis zum stichprobenmittelwert: die differenz
Zwei in der Statistik häufig verwendete Begriffe sind Stichprobenanteil und Stichprobenmittelwert .
Hier ist der Unterschied zwischen den beiden Begriffen:
Stichprobenanteil: Anteil der Beobachtungen in einer Stichprobe, die ein bestimmtes Merkmal aufweisen.
Oft als p̂ bezeichnet, wird es wie folgt berechnet:
p̂ = x / n
Gold:
- x: Die Anzahl der Beobachtungen in der Stichprobe mit einem bestimmten Merkmal.
- n: Die Gesamtzahl der Beobachtungen in der Stichprobe.
Stichprobenmittelwert: Durchschnittswert in einer Stichprobe.
Oft wird x angegeben und wie folgt berechnet:
x = Σx i / n
Gold:
- Σ: Ein Symbol, das „Summe“ bedeutet
- x i : Der Wert der i-ten Beobachtung in der Stichprobe
- n: Die Stichprobengröße
Verhältnis von Stichprobe zu Stichprobenmittelwert: wann jeweils zu verwenden ist
Der Stichprobenanteil und der Stichprobenmittelwert werden aus unterschiedlichen Gründen verwendet:
Stichprobenanteil: Wird verwendet, um den Anteil der Beobachtungen in einer Stichprobe zu verstehen, die ein bestimmtes Merkmal aufweisen.
Beispielsweise könnten wir den Stichprobenanteil in jedem der folgenden Szenarios verwenden:
- Politik: Forscher könnten 500 Menschen in einer bestimmten Stadt befragen, um herauszufinden, wie viel Prozent der Einwohner einen bestimmten Kandidaten bei einer bevorstehenden Wahl unterstützen.
- Biologie: Biologen können Daten von 100 Meeresschildkröten sammeln, um zu verstehen, wie viel von ihnen durch Verschmutzung geschädigt wurde.
- Sport: Ein Reporter könnte 1.000 College-Basketballspieler befragen, um herauszufinden, wie viel Prozent von ihnen Linkshänder schießen.
Stichprobenmittelwert: Wird verwendet, um den Mittelwert einer Stichprobe zu verstehen.
Beispielsweise könnten wir den Stichprobenmittelwert in jedem der folgenden Szenarios verwenden:
- Demografische Daten: Ökonomen können Daten zu 5.000 Haushalten in einer bestimmten Stadt sammeln, um das durchschnittliche jährliche Haushaltseinkommen zu schätzen.
- Botanik: Ein Botaniker kann Messungen an 50 Pflanzen derselben Art vornehmen, um die durchschnittliche Pflanzenhöhe in Zoll abzuschätzen.
- Ernährung: Ein Ernährungsberater könnte 100 Personen in einem Krankenhaus befragen, um die durchschnittliche Anzahl der Kalorien zu schätzen, die die Bewohner pro Tag verbrauchen.
Abhängig von der Frage, die Sie interessiert, kann es sinnvoller sein, den Stichprobenanteil oder den Stichprobenmittelwert zur Beantwortung der Frage zu verwenden.
Verwendung des Stichprobenanteils und des Stichprobenmittelwerts zur Schätzung von Populationsparametern
Der Stichprobenanteil und der Stichprobenmittelwert werden zur Schätzung der Grundgesamtheitsparameter verwendet.
Beispiel für einen Anteil zur Schätzung
Wir verwenden den Stichprobenanteil, um einen Bevölkerungsanteil zu schätzen. Beispielsweise könnte es uns interessieren, wie viel Prozent der Einwohner einer bestimmten Stadt ein neues Gesetz befürworten.
Da es zu kostspielig und zeitaufwändig wäre, alle 20.000 Einwohner der Stadt zu befragen, befragen wir stattdessen 500 und berechnen den Anteil der Einwohner in der Stichprobe, die das neue Gesetz unterstützen.
Anschließend verwenden wir diesen Stichprobenanteil als unsere beste Schätzung des Anteils der Einwohner in der gesamten Stadt, die das neue Gesetz übernehmen. Da es jedoch unwahrscheinlich ist, dass unser Stichprobenanteil genau mit dem Bevölkerungsanteil übereinstimmt, verwenden wir häufig ein Konfidenzintervall für einen Anteil – einen Wertebereich, von dem wir glauben, dass er den wahren Bevölkerungsanteil mit einem bestimmten Konfidenzniveau enthält.
Beispiel für einen Durchschnitt als Schätzung
Wir verwenden den Stichprobenmittelwert, um den Mittelwert einer Grundgesamtheit zu schätzen. Beispielsweise könnten wir daran interessiert sein, die durchschnittliche Höhe einer bestimmten Pflanzenart zu verstehen.
Da es zu teuer und zeitaufwändig wäre, die Höhe aller 10.000 Pflanzen in einer bestimmten Region zu messen, messen wir stattdessen die Höhe von 150 Pflanzen und verwenden den Stichprobenmittelwert als beste Schätzung des Populationsmittelwerts.
Da es jedoch unwahrscheinlich ist, dass unser Stichprobenmittelwert genau mit dem Populationsmittelwert übereinstimmt, verwenden wir häufig ein Konfidenzintervall für einen Mittelwert – einen Wertebereich, von dem wir glauben, dass er den wahren Populationsmittelwert mit einem bestimmten Konfidenzniveau enthält.
Zusätzliche Ressourcen
Konfidenzintervall für Proportionsrechner
Konfidenzintervall für den Durchschnittsrechner