Как интерпретировать межквартильный размах: с примерами
Межквартильный диапазон набора данных, часто сокращенно IQR, представляет собой разницу между первым квартилем (25-й процентиль) и третьим квартилем (75-й процентиль) набора данных.
Проще говоря, он измеряет отклонение между средними 50% значений.
IQR = Q3 – Q1
Например, предположим, что у нас есть следующий набор данных, показывающий высоту 17 различных растений (в дюймах) в лаборатории:
Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32.
Согласно калькулятору межквартильного диапазона, межквартильный размах (IQR) для этого набора данных рассчитывается следующим образом:
- Т1: 12
- Т3: 26,5
- IQR = Q3 – Q1 = 14,5
Это говорит нам о том, что средние 50% значений в наборе данных имеют разброс 14,5 дюймов.
Чем полезен межквартильный размах
Межквартильный размах — это один из способов измерения распределения значений в наборе данных, но существуют и другие меры распределения, такие как:
- Диапазон: измеряет разницу между минимальным и максимальным значением в наборе данных.
- Стандартное отклонение: измеряет типичное отклонение отдельных значений от среднего значения в наборе данных.
Преимущество использования межквартильного диапазона (IQR) для измерения распределения значений в наборе данных заключается в том, что на него не влияют экстремальные выбросы.
Например, чрезвычайно маленькое или чрезвычайно большое значение в наборе данных не повлияет на расчет IQR, поскольку IQR использует только значения 25-го и 75-го процентиля набора данных.
Чтобы проиллюстрировать это, рассмотрим следующий набор данных:
Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32.
Этот набор данных содержит следующие измерения распространения
- IQR: 14,5
- Стандартное отклонение: 9,25
- Диапазон: 31
Однако подумайте, имел ли набор данных экстремальный выброс:
Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378.
Мы могли бы использовать калькулятор, чтобы найти следующие измерения разброса для этого набора данных:
- IQR: 15
- Стандартное отклонение: 85,02
- Диапазон: 377
Обратите внимание, что межквартильный размах практически не меняется при наличии выброса, в то время как стандартное отклонение и размах изменяются резко.
Сравнение межквартильных диапазонов между наборами данных
Межквартильный размах также можно использовать для сравнения распределения значений между разными наборами данных.
Например, предположим, что у нас есть три набора данных со следующими значениями IQR:
- IQR набора данных 1: 13,5
- IQR набора данных 2: 24,4.
- Набор данных 3 IQR: 8,7
Это говорит нам о том, что разрыв между средними 50% значений является наибольшим для набора данных 2 и наименьшим для набора данных 3.
Дополнительные ресурсы
Как рассчитать межквартильный размах в Excel
Как рассчитать межквартильный размах в Python
Как найти выбросы, используя межквартильный размах
Калькулятор межквартильного диапазона