Zasięg vs. odchylenie standardowe: kiedy używać każdego z nich
Zakres i odchylenie standardowe to dwa sposoby pomiaru rozkładu wartości w zbiorze danych.
Zakres reprezentuje różnicę między wartością minimalną a wartością maksymalną w zestawie danych.
Odchylenie standardowe mierzy typowe odchylenie poszczególnych wartości od wartości średniej. Oblicza się go w następujący sposób:
s = √(Σ(x ja – x ) 2 / (n-1))
Złoto:
- Σ: Symbol oznaczający „sumę”
- x i : Wartość i-tej obserwacji w próbie
- x : Przykładowe środki
- n: Wielkość próbki
Załóżmy na przykład, że mamy następujący zestaw danych:
Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Zakres oblicza się następująco: 31 -1 = 32.
Możemy użyć kalkulatora, aby znaleźć, że odchylenie standardowe wynosi 9,25.
Rozstęp i odchylenie standardowe: podobieństwa i różnice
Zakres i odchylenie standardowe mają następujące podobieństwo:
- Obie metryki mierzą rozkład wartości w zbiorze danych.
Jednakże zakres i odchylenie standardowe mają następującą różnicę:
- Zakres informuje nas o różnicy pomiędzy największą i najmniejszą wartością w zbiorze danych.
- Odchylenie standardowe mówi nam o typowym odchyleniu poszczególnych wartości od średniej wartości zbioru danych.
Zasięg vs. Odchylenie standardowe: kiedy używać każdego z nich
Z zakresu musimy skorzystać, gdy chcemy zrozumieć różnicę pomiędzy największą i najmniejszą wartością w zbiorze danych.
Załóżmy na przykład, że profesor zdaje egzamin 100 studentom. Potrafi wykorzystać skalę, aby zrozumieć różnicę pomiędzy najwyższym i najniższym wynikiem uzyskanym przez wszystkich uczniów w klasie.
I odwrotnie, powinniśmy używać odchylenia standardowego , gdy chcemy zrozumieć, jak bardzo typowa wartość zbioru danych odbiega od wartości średniej.
Na przykład, jeśli profesor przeprowadza egzamin dla 100 studentów, może użyć odchylenia standardowego, aby określić, jak bardzo typowy wynik egzaminu odbiega od średniego wyniku egzaminu.
Warto zaznaczyć, że do opisu rozkładu wartości w zbiorze danych nie musimy wybierać pomiędzy wykorzystaniem zakresu czy odchylenia standardowego. Możemy stosować obydwa mierniki, gdyż dostarczają nam zupełnie innych informacji.
Wady zasięgu i odchylenia standardowego
Zarówno rozstęp, jak i odchylenie standardowe mają wadę: na oba wpływają wartości odstające .
Aby to zilustrować, rozważ następujący zbiór danych:
Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Możemy obliczyć następujące wartości dla zakresu i odchylenia standardowego tego zbioru danych:
- Zasięg: 31
- Odchylenie standardowe: 9,25
Należy jednak rozważyć, czy zbiór danych zawierał skrajną wartość odstającą:
Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
Możemy użyć kalkulatora, aby znaleźć następujące metryki dla tego zbioru danych:
- Zasięg: 377
- Odchylenie standardowe: 85,02
Zwróć uwagę, jak zakres i odchylenie standardowe zmieniają się znacząco ze względu na wartość odstającą.
Chociaż zakres i odchylenie standardowe mogą być przydatnymi miarami, aby zorientować się w rozkładzie wartości w zbiorze danych, należy najpierw upewnić się, że zbiór danych nie zawiera żadnych wartości odstających, które wpływają na te wartości. środki. W przeciwnym razie zakres i odchylenie standardowe mogą wprowadzać w błąd.