Reichweite vs. standardabweichung: wann jeweils zu verwenden ist
Bereich und Standardabweichung sind zwei Möglichkeiten, die Verteilung von Werten in einem Datensatz zu messen.
Der Bereich stellt die Differenz zwischen dem Minimalwert und dem Maximalwert in einem Datensatz dar.
Die Standardabweichung misst die typische Abweichung einzelner Werte vom Mittelwert. Es wird wie folgt berechnet:
s = √(Σ(x i – x ) 2 / (n-1))
Gold:
- Σ: Ein Symbol, das „Summe“ bedeutet
- x i : Der Wert der i-ten Beobachtung in der Stichprobe
- x : Das Stichprobenmittel
- n: Die Stichprobengröße
Angenommen, wir haben den folgenden Datensatz:
Datensatz: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Der Bereich wird wie folgt berechnet: 31 -1 = 32.
Mithilfe eines Taschenrechners können wir ermitteln, dass die Standardabweichung 9,25 beträgt.
Bereich und Standardabweichung: Ähnlichkeiten und Unterschiede
Bereich und Standardabweichung weisen die folgende Ähnlichkeit auf:
- Beide Metriken messen die Verteilung von Werten in einem Datensatz.
Der Bereich und die Standardabweichung unterscheiden sich jedoch wie folgt:
- Der Bereich gibt uns die Differenz zwischen dem größten und kleinsten Wert im Datensatz an.
- Die Standardabweichung gibt uns die typische Abweichung einzelner Werte vom Durchschnittswert des Datensatzes an.
Reichweite vs. Standardabweichung: Wann jeweils zu verwenden ist
Wir müssen den Bereich verwenden, wenn wir den Unterschied zwischen dem größten und dem kleinsten Wert in einem Datensatz verstehen möchten.
Angenommen, ein Professor gibt vor 100 Studenten eine Prüfung. Anhand der Skala kann sie den Unterschied zwischen der höchsten und der niedrigsten Punktzahl aller Schüler in der Klasse erkennen.
Umgekehrt sollten wir die Standardabweichung verwenden, wenn wir verstehen wollen, wie weit der typische Wert eines Datensatzes vom Durchschnittswert abweicht.
Wenn ein Professor beispielsweise eine Prüfung für 100 Studierende durchführt, kann er oder sie mithilfe der Standardabweichung quantifizieren, wie stark die typische Prüfungspunktzahl von der durchschnittlichen Prüfungspunktzahl abweicht.
Es ist erwähnenswert, dass wir uns nicht zwischen der Verwendung von Bereich oder Standardabweichung zur Beschreibung der Werteverteilung in einem Datensatz entscheiden müssen. Wir können beide Metriken verwenden, weil sie uns völlig unterschiedliche Informationen liefern.
Die Nachteile von Reichweite und Standardabweichung
Sowohl der Bereich als auch die Standardabweichung haben einen Nachteil: Sie werden beide von Ausreißern beeinflusst .
Betrachten Sie zur Veranschaulichung den folgenden Datensatz:
Datensatz: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Wir können die folgenden Werte für den Bereich und die Standardabweichung dieses Datensatzes berechnen:
- Bereich: 31
- Standardabweichung: 9,25
Bedenken Sie jedoch, ob der Datensatz einen extremen Ausreißer aufweist:
Datensatz: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
Wir könnten einen Rechner verwenden, um die folgenden Metriken für diesen Datensatz zu ermitteln:
- Bereich: 377
- Standardabweichung: 85,02
Beachten Sie, wie sich der Bereich und die Standardabweichung aufgrund eines Ausreißers erheblich ändern.
Obwohl Bereich und Standardabweichung nützliche Maße sein können, um sich ein Bild von der Werteverteilung in einem Datensatz zu machen, müssen Sie zunächst sicherstellen, dass der Datensatz keine Ausreißer enthält, die diese Werte beeinflussen. Maßnahmen. Andernfalls können der Bereich und die Standardabweichung irreführend sein.