Co uważa się za dobre odchylenie standardowe?


Odchylenie standardowe służy do pomiaru rozkładu wartości w próbce.

Do obliczenia odchylenia standardowego danej próbki możemy posłużyć się następującym wzorem:

Σ(x i – x bar ) 2 / (n-1)

Złoto:

  • Σ: Symbol oznaczający „sumę”
  • x i : i-ta wartość próbki
  • x słupek : Oznacza próbkę
  • n: Wielkość próbki

Im wyższa wartość odchylenia standardowego, tym bardziej rozproszone są wartości w próbce . I odwrotnie, im niższa wartość odchylenia standardowego, tym bardziej wartości są skupione.

Często zadawane przez uczniów pytanie brzmi: jaka wartość odchylenia standardowego jest uważana za dobrą?

Odpowiedź: Odchylenie standardowe nie może być „dobre” ani „złe”, ponieważ po prostu mówi nam o rozkładzie wartości w próbie.

Nie ma również uniwersalnej liczby pozwalającej określić, czy odchylenie standardowe jest „wysokie”, czy „niskie”. Rozważmy na przykład następujące scenariusze:

Scenariusz 1: Agent nieruchomości zbiera dane o cenach 100 domów w swoim mieście i stwierdza, że odchylenie standardowe cen wynosi 12 000 dolarów.

Scenariusz 2 : Ekonomista mierzy całkowity podatek dochodowy pobrany w 50 stanach Stanów Zjednoczonych i stwierdza, że odchylenie standardowe całkowitego pobranego podatku dochodowego wynosi 480 000 dolarów.

Chociaż odchylenie standardowe w scenariuszu 2 jest znacznie wyższe niż odchylenie standardowe w scenariuszu 1, jednostki mierzone w scenariuszu 2 są znacznie wyższe, ponieważ łączne podatki pobierane przez państwa są oczywiście znacznie wyższe od cen nieruchomości.

Oznacza to, że nie ma jednej liczby, za pomocą której możemy określić, czy odchylenie standardowe jest „dobre”, czy „złe”, a nawet „wysokie” czy „niskie”, ponieważ zależy to od sytuacji.

Skorzystaj ze współczynnika zmienności

Jednym ze sposobów ustalenia, czy odchylenie standardowe jest wysokie, jest porównanie go ze średnią zbioru danych.

Współczynnik zmienności , często w skrócie CV , to sposób pomiaru rozrzutu wartości w zbiorze danych w stosunku do średniej. Oblicza się go w następujący sposób:

CV = s/ x

Złoto:

  • s: odchylenie standardowe zbioru danych
  • x : średnia ze zbioru danych

Mówiąc najprościej, CV to stosunek odchylenia standardowego do średniej.

Im wyższe CV, tym większe odchylenie standardowe od średniej. Ogólnie rzecz biorąc, wartość CV większa niż 1 jest często uważana za wysoką.

Załóżmy na przykład, że agentka nieruchomości zbiera dane o cenach 100 domów w swoim mieście i stwierdza, że średnia cena wynosi 150 000 dolarów, a odchylenie standardowe cen wynosi 12 000 dolarów. CV zostanie obliczone w następujący sposób:

  • CV: 12 000 USD / 150 000 USD = 0,08

Ponieważ ta wartość CV jest znacznie mniejsza niż 1, mówi nam to, że odchylenie standardowe danych jest dość niskie.

I odwrotnie, załóżmy, że ekonomista mierzy całkowity podatek dochodowy pobierany w 50 stanach Stanów Zjednoczonych i stwierdza, że średnia próbki wynosi 400 000 dolarów, a odchylenie standardowe wynosi 480 000 dolarów. CV zostanie obliczone w następujący sposób:

  • CV: 480 000 USD / 400 000 USD = 1,2

Ponieważ ta wartość CV jest większa niż 1, mówi nam to, że odchylenie standardowe wartości danych jest dość wysokie.

Porównywanie odchyleń standardowych między zbiorami danych

Często używamy odchylenia standardowego do pomiaru rozkładu wartości w różnych zbiorach danych.

Załóżmy na przykład, że profesor zdaje swoim studentom trzy egzaminy w ciągu semestru. Następnie oblicza odchylenie standardowe wyników każdego egzaminu:

  • Przykładowe odchylenie standardowe wyników egzaminu 1: 4.6
  • Przykładowe odchylenie standardowe wyników egzaminu 2: 12.4
  • Przykład odchylenia standardowego wyników egzaminu 3: 2.3

To mówi profesorowi, że wyniki egzaminu były najbardziej rozproszone w przypadku egzaminu 2, podczas gdy wyniki były najbardziej skupione w przypadku egzaminu 3.

Dodatkowe zasoby

Odchylenie standardowe i błąd standardowy: jaka jest różnica?
Odchylenie standardowe a rozstęp międzykwartylowy: jaka jest różnica?

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *