Was gilt als gute standardabweichung?


Die Standardabweichung wird verwendet, um die Werteverteilung in einer Stichprobe zu messen.

Mit der folgenden Formel können wir die Standardabweichung einer bestimmten Stichprobe berechnen:

Σ(x i – x bar ) 2 / (n-1)

Gold:

  • Σ: Ein Symbol, das „Summe“ bedeutet
  • x i : der i-te Wert der Stichprobe
  • x bar : Der Stichprobenmittelwert
  • n: Die Stichprobengröße

Je höher der Standardabweichungswert ist, desto stärker sind die Werte in einer Stichprobe gestreut. Umgekehrt gilt: Je niedriger der Standardabweichungswert, desto enger sind die Werte geclustert.

Eine von Studierenden häufig gestellte Frage lautet: Was gilt als guter Wert für die Standardabweichung?

Die Antwort: Eine Standardabweichung kann nicht „gut“ oder „schlecht“ sein, da sie uns lediglich die Verteilung der Werte in einer Stichprobe angibt.

Es gibt auch keine allgemeingültige Zahl zur Bestimmung, ob eine Standardabweichung „hoch“ oder „niedrig“ ist. Betrachten Sie beispielsweise die folgenden Szenarien:

Szenario 1: Ein Immobilienmakler sammelt Preisdaten für 100 Häuser in seiner Stadt und stellt fest, dass die Standardabweichung der Preise 12.000 US-Dollar beträgt.

Szenario 2 : Ein Ökonom misst die gesamte in den 50 Bundesstaaten der Vereinigten Staaten erhobene Einkommensteuer und stellt fest, dass die Standardabweichung der insgesamt erhobenen Einkommensteuer 480.000 US-Dollar beträgt.

Obwohl die Standardabweichung von Szenario 2 viel höher ist als die Standardabweichung von Szenario 1, sind die in Szenario 2 gemessenen Einheiten viel höher, da die von den Staaten insgesamt erhobenen Steuern offensichtlich viel höher sind als die Immobilienpreise.

Das bedeutet, dass es keine einzelne Zahl gibt, anhand derer wir bestimmen können, ob eine Standardabweichung „gut“ oder „schlecht“ oder sogar „hoch“ oder „niedrig“ ist, da dies von der Situation abhängt.

Verwenden Sie den Variationskoeffizienten

Eine Möglichkeit, festzustellen, ob eine Standardabweichung hoch ist, besteht darin, sie mit dem Mittelwert des Datensatzes zu vergleichen.

Ein Variationskoeffizient , oft mit CV abgekürzt, ist eine Möglichkeit, die Streuung von Werten in einem Datensatz relativ zum Mittelwert zu messen. Es wird wie folgt berechnet:

Lebenslauf = s/ x

Gold:

  • s: die Standardabweichung des Datensatzes
  • x : der Durchschnitt des Datensatzes

Einfach ausgedrückt ist CV das Verhältnis der Standardabweichung zum Mittelwert.

Je höher der CV, desto höher ist die Standardabweichung vom Mittelwert. Im Allgemeinen wird ein CV-Wert größer als 1 oft als hoch angesehen.

Angenommen, eine Immobilienmaklerin sammelt Preisdaten für 100 Häuser in ihrer Stadt und stellt fest, dass der Durchschnittspreis 150.000 US-Dollar beträgt und die Standardabweichung der Preise 12.000 US-Dollar beträgt. Der CV würde wie folgt berechnet:

  • Lebenslauf: 12.000 $ / 150.000 $ = 0,08

Da dieser CV-Wert viel kleiner als 1 ist, bedeutet dies, dass die Standardabweichung der Daten recht gering ist.

Angenommen, ein Wirtschaftswissenschaftler misst die gesamten in den 50 Bundesstaaten der Vereinigten Staaten erhobenen Einkommenssteuern und stellt fest, dass der Stichprobenmittelwert 400.000 US-Dollar und die Standardabweichung 480.000 US-Dollar beträgt. Der CV würde wie folgt berechnet:

  • Lebenslauf: 480.000 $ / 400.000 $ = 1,2

Da dieser CV-Wert größer als 1 ist, bedeutet dies, dass die Standardabweichung der Datenwerte recht hoch ist.

Vergleich von Standardabweichungen zwischen Datensätzen

Wir verwenden häufig die Standardabweichung, um die Verteilung von Werten über verschiedene Datensätze hinweg zu messen.

Angenommen, ein Professor legt seinen Studenten im Laufe eines Semesters drei Prüfungen ab. Anschließend wird die Standardabweichung der Ergebnisse für jede Prüfung berechnet:

  • Beispiel-Standardabweichung der Prüfungsergebnisse 1: 4,6
  • Beispiel-Standardabweichung der Prüfungsergebnisse 2: 12,4
  • Beispiel für die Standardabweichung der Prüfungsergebnisse 3: 2.3

Dies sagt dem Professor, dass die Prüfungsergebnisse bei Prüfung 2 am stärksten verstreut waren, während die Ergebnisse bei Prüfung 3 am stärksten gehäuft waren.

Zusätzliche Ressourcen

Standardabweichung und Standardfehler: Was ist der Unterschied?
Standardabweichung versus Interquartilbereich: Was ist der Unterschied?

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert