Rozstęp międzykwartylowy i odchylenie standardowe: jaka jest różnica?

Przez Benjamin Anderson 26 lipca, 2023 Przewodnik 0 komentarzy

Rozstęp międzykwartylowy i odchylenie standardowe to dwa sposoby pomiaru rozkładu wartości w zbiorze danych.

Ten samouczek zawiera krótkie wyjaśnienie poszczególnych metryk wraz z podobieństwami i różnicami między nimi.

Zakres międzykwartylowy

Rozstęp międzykwartylowy (IQR) zbioru danych to różnica między pierwszym kwartylem (25. percentyl) a trzecim kwartylem (75. percentyl). Mierzy rozkład średnich 50% wartości.

IQR = Q3 – Q1

Załóżmy na przykład, że mamy następujący zestaw danych:

Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Według kalkulatora rozstępu międzykwartylowego rozstęp międzykwartylowy (IQR) dla tego zbioru danych oblicza się w następujący sposób:

T1: 12
T3: 26,5
IQR = Q3 – Q1 = 14,5

To mówi nam, że środkowe 50% wartości w zbiorze danych ma odchylenie 14,5 .

Odchylenie standardowe

Odchylenie standardowe zbioru danych jest sposobem pomiaru typowego odchylenia poszczególnych wartości od wartości średniej. Oblicza się go w następujący sposób:

s = √(Σ(x _ja – x ) ² / (n-1))

Załóżmy na przykład, że mamy następujący zestaw danych:

Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Możemy użyć kalkulatora, aby stwierdzić, że odchylenie standardowe tego zbioru danych wynosi 9,25 . Daje nam to wyobrażenie o tym, jak daleko typowa wartość odbiega od średniej.

Podobieństwa i różnice

Rozstęp międzykwartylowy i odchylenie standardowe mają następujące podobieństwo:

Obie metryki mierzą rozkład wartości w zbiorze danych.

Jednak rozstęp międzykwartylowy i odchylenie standardowe mają następującą kluczową różnicę:

Skrajne wartości odstające nie mają wpływu na rozstęp międzykwartylowy (IQR). Na przykład wyjątkowo mała lub bardzo duża wartość w zbiorze danych nie będzie miała wpływu na obliczenia IQR, ponieważ IQR wykorzystuje tylko wartości 25. percentyla i 75. percentyla zbioru danych.
Na odchylenie standardowe wpływają skrajne wartości odstające. Na przykład wyjątkowo duża wartość w zbiorze danych spowoduje znacznie większe odchylenie standardowe, ponieważ odchylenie standardowe uwzględnia w swojej formule każdą wartość ze zbioru danych.

Kiedy używać każdego z nich

Rozstępu międzykwartylowego należy używać do pomiaru rozkładu wartości w zbiorze danych, gdy występują skrajne wartości odstające.

I odwrotnie, do pomiaru rozkładu wartości należy używać odchylenia standardowego, gdy nie ma skrajnych wartości odstających.

Aby zilustrować dlaczego, rozważ następujący zbiór danych:

Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

We wcześniejszej części artykułu obliczyliśmy następujące metryki dla tego zbioru danych:

IQR: 14,5
Odchylenie standardowe: 9,25

Należy jednak rozważyć, czy zbiór danych zawierał skrajną wartość odstającą:

Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

Możemy użyć kalkulatora, aby znaleźć następujące metryki dla tego zbioru danych:

IQR: 15
Odchylenie standardowe: 85,02

Należy zauważyć, że rozstęp międzykwartylowy prawie się nie zmienia, gdy występuje wartość odstająca, podczas gdy odchylenie standardowe wzrasta z 9,25 do 85,02.

Dodatkowe zasoby

Miary tendencji centralnej: definicja i przykłady
Miary dyspersji: definicja i przykłady
Jak znaleźć wartości odstające za pomocą rozstępu międzykwartylowego

o autorze

Dr Benjamin Anderson

Cześć, jestem Benjamin i jestem emerytowanym profesorem statystyki, który został oddanym nauczycielem Statorials. Dzięki bogatemu doświadczeniu i wiedzy specjalistycznej w dziedzinie statystyki chętnie dzielę się swoją wiedzą, aby wzmocnić pozycję uczniów za pośrednictwem Statorials. Wiedzieć więcej

Zakres międzykwartylowy

Podobieństwa i różnice

Kiedy używać każdego z nich

Dodatkowe zasoby

o autorze

Dr Benjamin Anderson

Dodaj komentarz