Rozstęp międzykwartylowy i odchylenie standardowe: jaka jest różnica?
Rozstęp międzykwartylowy i odchylenie standardowe to dwa sposoby pomiaru rozkładu wartości w zbiorze danych.
Ten samouczek zawiera krótkie wyjaśnienie poszczególnych metryk wraz z podobieństwami i różnicami między nimi.
Zakres międzykwartylowy
Rozstęp międzykwartylowy (IQR) zbioru danych to różnica między pierwszym kwartylem (25. percentyl) a trzecim kwartylem (75. percentyl). Mierzy rozkład średnich 50% wartości.
IQR = Q3 – Q1
Załóżmy na przykład, że mamy następujący zestaw danych:
Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Według kalkulatora rozstępu międzykwartylowego rozstęp międzykwartylowy (IQR) dla tego zbioru danych oblicza się w następujący sposób:
- T1: 12
- T3: 26,5
- IQR = Q3 – Q1 = 14,5
To mówi nam, że środkowe 50% wartości w zbiorze danych ma odchylenie 14,5 .
Odchylenie standardowe
Odchylenie standardowe zbioru danych jest sposobem pomiaru typowego odchylenia poszczególnych wartości od wartości średniej. Oblicza się go w następujący sposób:
s = √(Σ(x ja – x ) 2 / (n-1))
Załóżmy na przykład, że mamy następujący zestaw danych:
Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Możemy użyć kalkulatora, aby stwierdzić, że odchylenie standardowe tego zbioru danych wynosi 9,25 . Daje nam to wyobrażenie o tym, jak daleko typowa wartość odbiega od średniej.
Podobieństwa i różnice
Rozstęp międzykwartylowy i odchylenie standardowe mają następujące podobieństwo:
- Obie metryki mierzą rozkład wartości w zbiorze danych.
Jednak rozstęp międzykwartylowy i odchylenie standardowe mają następującą kluczową różnicę:
- Skrajne wartości odstające nie mają wpływu na rozstęp międzykwartylowy (IQR). Na przykład wyjątkowo mała lub bardzo duża wartość w zbiorze danych nie będzie miała wpływu na obliczenia IQR, ponieważ IQR wykorzystuje tylko wartości 25. percentyla i 75. percentyla zbioru danych.
- Na odchylenie standardowe wpływają skrajne wartości odstające. Na przykład wyjątkowo duża wartość w zbiorze danych spowoduje znacznie większe odchylenie standardowe, ponieważ odchylenie standardowe uwzględnia w swojej formule każdą wartość ze zbioru danych.
Kiedy używać każdego z nich
Rozstępu międzykwartylowego należy używać do pomiaru rozkładu wartości w zbiorze danych, gdy występują skrajne wartości odstające.
I odwrotnie, do pomiaru rozkładu wartości należy używać odchylenia standardowego, gdy nie ma skrajnych wartości odstających.
Aby zilustrować dlaczego, rozważ następujący zbiór danych:
Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
We wcześniejszej części artykułu obliczyliśmy następujące metryki dla tego zbioru danych:
- IQR: 14,5
- Odchylenie standardowe: 9,25
Należy jednak rozważyć, czy zbiór danych zawierał skrajną wartość odstającą:
Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
Możemy użyć kalkulatora, aby znaleźć następujące metryki dla tego zbioru danych:
- IQR: 15
- Odchylenie standardowe: 85,02
Należy zauważyć, że rozstęp międzykwartylowy prawie się nie zmienia, gdy występuje wartość odstająca, podczas gdy odchylenie standardowe wzrasta z 9,25 do 85,02.
Dodatkowe zasoby
Miary tendencji centralnej: definicja i przykłady
Miary dyspersji: definicja i przykłady
Jak znaleźć wartości odstające za pomocą rozstępu międzykwartylowego