Stichprobenvarianz

In diesem Artikel wird erklärt, was Stichprobenvarianz in der Statistik ist und was der Unterschied zwischen Stichprobenvarianz und Populationsvarianz ist. So finden Sie Anleitungen zum Berechnen der Varianz einer Stichprobe, eine gelöste Übung und darüber hinaus einen Online-Rechner, mit dem Sie die Varianz einer beliebigen Stichprobe ermitteln können.

Was ist die Stichprobenvarianz?

Die Stichprobenvarianz ist ein Maß für die Streuung, das die Variabilität einer statistischen Stichprobe angibt. Um die Stichprobenvarianz zu berechnen, addieren Sie die Quadrate aller Stichprobenresiduen und dividieren Sie dann durch die Stichprobengröße minus eins.

Das Symbol für die Stichprobenvarianz ist s 2 .

Die Interpretation des Stichprobenvarianzwerts ist einfach: Je größer der Stichprobenvarianzwert, desto stärker gestreut sind die Stichprobendaten. Ein großer Wert der Stichprobenvarianz bedeutet also, dass die Daten weit voneinander entfernt sind, während ein kleiner Wert der Stichprobenvarianz anzeigt, dass die Daten sehr nahe beieinander liegen. Allerdings muss man bei der Interpretation der Stichprobenvarianz auf Ausreißer achten, da diese den Stichprobenvarianzwert verfälschen können.

Beispiel für eine Varianzformel

Die Stichprobenvarianz entspricht der Summe der Quadrate der Stichprobenresiduen dividiert durch die Gesamtzahl der Beobachtungen minus eins.

Daher lautet die Formel zur Berechnung der Stichprobenvarianz :

Stichprobenvarianzformel

Gold:

  • s^2

    ist die Stichprobenvarianz.

  • \overline{x}

    ist das Beispielmittel.

  • x_i

    ist der Datenwert

    i

    .

  • n

    ist die Gesamtzahl der Datenelemente in der Stichprobe.

👉 Mit dem Rechner unten können Sie die Varianz beliebiger Beispieldaten berechnen.

Beispiel einer Abweichungsberechnung

Sobald wir die Definition der Stichprobenvarianz und ihre Formel kennen, lösen wir ein einfaches Beispiel, um zu verstehen, wie sie berechnet wird:

  • Ein Schuhunternehmen führt eine Marktforschung durch, um zu entscheiden, ob ein neues Schuhmodell auf den Markt gebracht werden soll. Da es viele verschiedene Modelle gibt und Sie nur eine kurze Vorabanalyse durchführen möchten, entscheiden Sie sich, sich einfach den Preis einer Auswahl der fünf größten konkurrierenden Schuhmarken anzusehen (die Preise sind unten aufgeführt). Wie hoch ist die Stichprobenvarianz dieses Datensatzes?

98 € 70 € 125 € 89 € 75

Zuerst müssen wir den Stichprobenmittelwert berechnen:

\overline{x}=\cfrac{98+70+125+89+75}{5}=91,4

Nachdem wir nun den Stichprobenmittelwert kennen, wenden wir die Stichprobenvarianzformel an:

s^2=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n-1}

Wir setzen die Beispieldaten in die Formel ein:

s^2=\cfrac{\displaystyle (98-91,4)^2+(70-91,4)^2+(125-91,4)^2+(89-91,4)^2+(75-91,4)^2}{5-1}

Jetzt müssen nur noch die Operationen zur Berechnung der Stichprobenvarianz gelöst werden:

\begin{aligned}s^2&=\cfrac{6,6^2+(-21,4)^2+33,6^2+(-2,4)^2+(-16,4)^2}{4}\\[2ex]s^2&=\cfrac{43,56+457,96+1128,96+5,76+268,96}{4}\\[2ex]s^2&= \cfrac{1905,2}{4} \\[2ex]s^2&=476,3 \end{aligned}

Die Varianz der analysierten Stichprobe beträgt somit 476,3 2 €. Beachten Sie, dass die Einheiten der Stichprobenvarianz dieselben Einheiten wie die statistischen Daten sind, jedoch quadriert.

Stichprobenvarianz und Populationsvarianz

In diesem Abschnitt werden wir den Unterschied zwischen Stichprobenvarianz und Populationsvarianz sehen, da es sich um zwei statistische Konzepte handelt, deren Unterscheidung wichtig ist.

In der Statistik ist die Populationsvarianz die Varianz, die man erhält, wenn man die Berechnung mit allen Elementen der Population durchführt, während die Stichprobenvarianz die Varianz ist, die man erhält, wenn man die Berechnung nur mit einer Stichprobe von Daten aus der Population durchführt.

Mathematisch gesehen ist die Differenz zwischen der Stichprobenvarianz und der Populationsvarianz der Nenner der Formel, mit der sie berechnet wird. Um die Stichprobenvarianz zu berechnen, muss diese durch n-1 geteilt werden. Die Populationsvarianz wird jedoch durch Division durch n berechnet.

Um die Stichprobenvarianz von der Populationsvarianz zu unterscheiden, werden unterschiedliche Symbole verwendet. Das Symbol für die Stichprobenvarianz ist s2 , während das Symbol für die Populationsvarianz σ2 ist.

Daher wird die Stichprobenvarianz verwendet, um den wahren Wert der Varianz der gesamten Grundgesamtheit zu schätzen, da es normalerweise nicht möglich ist, alle Werte einer Grundgesamtheit zu kennen und daher eine Annäherung an ihre statistischen Parameter erfolgen muss. .

Siehe: Populationsvarianz

Beispiel für einen Gap-Rechner

Geben Sie die Daten einer Stichprobe in den folgenden Rechner ein, um deren Stichprobenvarianz zu berechnen. Die Daten müssen durch ein Leerzeichen getrennt und mit dem Punkt als Dezimaltrennzeichen eingegeben werden.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert