Rozstęp międzykwartylowy i odchylenie standardowe: jaka jest różnica?


Rozstęp międzykwartylowy i odchylenie standardowe to dwa sposoby pomiaru rozkładu wartości w zbiorze danych.

Ten samouczek zawiera krótkie wyjaśnienie poszczególnych metryk wraz z podobieństwami i różnicami między nimi.

Zakres międzykwartylowy

Rozstęp międzykwartylowy (IQR) zbioru danych to różnica między pierwszym kwartylem (25. percentyl) a trzecim kwartylem (75. percentyl). Mierzy rozkład średnich 50% wartości.

IQR = Q3 – Q1

Załóżmy na przykład, że mamy następujący zestaw danych:

Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Według kalkulatora rozstępu międzykwartylowego rozstęp międzykwartylowy (IQR) dla tego zbioru danych oblicza się w następujący sposób:

  • T1: 12
  • T3: 26,5
  • IQR = Q3 – Q1 = 14,5

To mówi nam, że środkowe 50% wartości w zbiorze danych ma odchylenie 14,5 .

Odchylenie standardowe

Odchylenie standardowe zbioru danych jest sposobem pomiaru typowego odchylenia poszczególnych wartości od wartości średniej. Oblicza się go w następujący sposób:

s = √(Σ(x jax ) 2 / (n-1))

Załóżmy na przykład, że mamy następujący zestaw danych:

Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Możemy użyć kalkulatora, aby stwierdzić, że odchylenie standardowe tego zbioru danych wynosi 9,25 . Daje nam to wyobrażenie o tym, jak daleko typowa wartość odbiega od średniej.

Podobieństwa i różnice

Rozstęp międzykwartylowy i odchylenie standardowe mają następujące podobieństwo:

  • Obie metryki mierzą rozkład wartości w zbiorze danych.

Jednak rozstęp międzykwartylowy i odchylenie standardowe mają następującą kluczową różnicę:

  • Skrajne wartości odstające nie mają wpływu na rozstęp międzykwartylowy (IQR). Na przykład wyjątkowo mała lub bardzo duża wartość w zbiorze danych nie będzie miała wpływu na obliczenia IQR, ponieważ IQR wykorzystuje tylko wartości 25. percentyla i 75. percentyla zbioru danych.
  • Na odchylenie standardowe wpływają skrajne wartości odstające. Na przykład wyjątkowo duża wartość w zbiorze danych spowoduje znacznie większe odchylenie standardowe, ponieważ odchylenie standardowe uwzględnia w swojej formule każdą wartość ze zbioru danych.

Kiedy używać każdego z nich

Rozstępu międzykwartylowego należy używać do pomiaru rozkładu wartości w zbiorze danych, gdy występują skrajne wartości odstające.

I odwrotnie, do pomiaru rozkładu wartości należy używać odchylenia standardowego, gdy nie ma skrajnych wartości odstających.

Aby zilustrować dlaczego, rozważ następujący zbiór danych:

Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

We wcześniejszej części artykułu obliczyliśmy następujące metryki dla tego zbioru danych:

  • IQR: 14,5
  • Odchylenie standardowe: 9,25

Należy jednak rozważyć, czy zbiór danych zawierał skrajną wartość odstającą:

Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

Możemy użyć kalkulatora, aby znaleźć następujące metryki dla tego zbioru danych:

  • IQR: 15
  • Odchylenie standardowe: 85,02

Należy zauważyć, że rozstęp międzykwartylowy prawie się nie zmienia, gdy występuje wartość odstająca, podczas gdy odchylenie standardowe wzrasta z 9,25 do 85,02.

Dodatkowe zasoby

Miary tendencji centralnej: definicja i przykłady
Miary dyspersji: definicja i przykłady
Jak znaleźć wartości odstające za pomocą rozstępu międzykwartylowego

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *