Jak interpretować rozstęp międzykwartylowy: z przykładami


Rozstęp międzykwartylowy zbioru danych, często w skrócie IQR, to różnica między pierwszym kwartylem (25. percentyl) a trzecim kwartylem (75. percentyl) zbioru danych.

W uproszczeniu mierzy odchylenie pomiędzy środkowymi 50% wartości.

IQR = Q3 – Q1

Załóżmy na przykład, że mamy następujący zbiór danych pokazujący wysokość 17 różnych roślin (w calach) w laboratorium:

Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Według kalkulatora rozstępu międzykwartylowego rozstęp międzykwartylowy (IQR) dla tego zbioru danych oblicza się w następujący sposób:

  • T1: 12
  • T3: 26,5
  • IQR = Q3 – Q1 = 14,5

To mówi nam, że środkowe 50% wartości w zbiorze danych ma rozpiętość 14,5 cala.

Dlaczego rozstęp międzykwartylowy jest przydatny

Rozstęp międzykwartylowy to jeden ze sposobów pomiaru rozkładu wartości w zbiorze danych, ale istnieją inne miary rozkładu, takie jak:

  • Zakres: Mierzy różnicę między wartością minimalną i maksymalną w zestawie danych.
  • Odchylenie standardowe: Mierzy typowe odchylenie poszczególnych wartości od średniej wartości w zestawie danych.

Zaletą stosowania rozstępu międzykwartylowego (IQR) do pomiaru rozkładu wartości w zbiorze danych jest to, że nie mają na niego wpływu skrajne wartości odstające.

Na przykład wyjątkowo mała lub bardzo duża wartość w zbiorze danych nie będzie miała wpływu na obliczenia IQR, ponieważ IQR wykorzystuje tylko wartości 25. percentyla i 75. percentyla zbioru danych.

Aby to zilustrować, rozważ następujący zbiór danych:

Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Ten zbiór danych zawiera następujące pomiary propagacji

  • IQR: 14,5
  • Odchylenie standardowe: 9,25
  • Zasięg: 31

Należy jednak rozważyć, czy zbiór danych zawierał skrajną wartość odstającą:

Zbiór danych: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

Możemy użyć kalkulatora, aby znaleźć następujące pomiary rozrzutu dla tego zbioru danych:

  • IQR: 15
  • Odchylenie standardowe: 85,02
  • Zasięg: 377

Należy zauważyć, że rozstęp międzykwartylowy prawie się nie zmienia, gdy występuje wartość odstająca, podczas gdy odchylenie standardowe i zakres zmieniają się dramatycznie.

Porównywanie rozstępów międzykwartylowych między zbiorami danych

Rozstęp międzykwartylowy można również wykorzystać do porównania rozkładu wartości pomiędzy różnymi zbiorami danych.

Załóżmy na przykład, że mamy trzy zbiory danych z następującymi wartościami IQR:

  • IQR zbioru danych 1: 13,5
  • IQR zbioru danych 2: 24,4
  • Zbiór danych 3 IQR: 8,7

Mówi nam to, że różnica pomiędzy środkowymi 50% wartości jest największa dla zbioru danych 2 i najmniejsza dla zbioru danych 3.

Dodatkowe zasoby

Jak obliczyć rozstęp międzykwartylowy w programie Excel
Jak obliczyć rozstęp międzykwartylowy w Pythonie
Jak znaleźć wartości odstające za pomocą rozstępu międzykwartylowego
Kalkulator rozstępu międzykwartylowego

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *