Как интерпретировать межквартильный размах: с примерами


Межквартильный диапазон набора данных, часто сокращенно IQR, представляет собой разницу между первым квартилем (25-й процентиль) и третьим квартилем (75-й процентиль) набора данных.

Проще говоря, он измеряет отклонение между средними 50% значений.

IQR = Q3 – Q1

Например, предположим, что у нас есть следующий набор данных, показывающий высоту 17 различных растений (в дюймах) в лаборатории:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32.

Согласно калькулятору межквартильного диапазона, межквартильный размах (IQR) для этого набора данных рассчитывается следующим образом:

  • Т1: 12
  • Т3: 26,5
  • IQR = Q3 – Q1 = 14,5

Это говорит нам о том, что средние 50% значений в наборе данных имеют разброс 14,5 дюймов.

Чем полезен межквартильный размах

Межквартильный размах — это один из способов измерения распределения значений в наборе данных, но существуют и другие меры распределения, такие как:

  • Диапазон: измеряет разницу между минимальным и максимальным значением в наборе данных.
  • Стандартное отклонение: измеряет типичное отклонение отдельных значений от среднего значения в наборе данных.

Преимущество использования межквартильного диапазона (IQR) для измерения распределения значений в наборе данных заключается в том, что на него не влияют экстремальные выбросы.

Например, чрезвычайно маленькое или чрезвычайно большое значение в наборе данных не повлияет на расчет IQR, поскольку IQR использует только значения 25-го и 75-го процентиля набора данных.

Чтобы проиллюстрировать это, рассмотрим следующий набор данных:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32.

Этот набор данных содержит следующие измерения распространения

  • IQR: 14,5
  • Стандартное отклонение: 9,25
  • Диапазон: 31

Однако подумайте, имел ли набор данных экстремальный выброс:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378.

Мы могли бы использовать калькулятор, чтобы найти следующие измерения разброса для этого набора данных:

  • IQR: 15
  • Стандартное отклонение: 85,02
  • Диапазон: 377

Обратите внимание, что межквартильный размах практически не меняется при наличии выброса, в то время как стандартное отклонение и размах изменяются резко.

Сравнение межквартильных диапазонов между наборами данных

Межквартильный размах также можно использовать для сравнения распределения значений между разными наборами данных.

Например, предположим, что у нас есть три набора данных со следующими значениями IQR:

  • IQR набора данных 1: 13,5
  • IQR набора данных 2: 24,4.
  • Набор данных 3 IQR: 8,7

Это говорит нам о том, что разрыв между средними 50% значений является наибольшим для набора данных 2 и наименьшим для набора данных 3.

Дополнительные ресурсы

Как рассчитать межквартильный размах в Excel
Как рассчитать межквартильный размах в Python
Как найти выбросы, используя межквартильный размах
Калькулятор межквартильного диапазона

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *