Интервал против. межквартильный размах: в чем разница?
В статистике интервал и межквартильный размах — это два способа измерения распределения значений в наборе данных.
Диапазон измеряет разницу между минимальным и максимальным значением в наборе данных.
Межквартильный диапазон измеряет разницу между первым квартилем (25-й процентиль) и третьим квартилем (75-й процентиль) в наборе данных. Это представляет собой распределение средних 50% значений.
Пример: Как рассчитать интервал и межквартильный размах
Предположим, у нас есть следующий набор данных:
Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32.
Для расчета диапазона мы можем использовать следующие шаги:
- Диапазон = Максимальное значение – Минимальное значение
- Диапазон = 32 – 1
- Диапазон = 31
Мы можем использовать калькулятор межквартильного диапазона, чтобы рассчитать межквартильный диапазон :
- Межквартильная шкала = 3-й квартиль – 1-й квартиль
- Интерквартильная шкала = 26,5 – 12
- Межквартильный размах = 14,5
Диапазон говорит нам о распределении набора данных, а межквартильный диапазон говорит нам о распределении средней половины набора данных.
Диапазон и межквартильный размах: сходства и различия
Интервал и межквартильный размах имеют следующее сходство:
- Обе метрики измеряют распределение значений в наборе данных.
Однако интервал и межквартильный размах имеют следующее отличие:
- Диапазон показывает нам разницу между наибольшим и наименьшим значением в наборе данных.
- Межквартильный диапазон говорит нам о распределении средних 50% значений в наборе данных.
Интервал и межквартильный диапазон: когда использовать каждый
Нам нужно использовать диапазон , когда мы хотим понять разницу между наибольшим и наименьшим значениями в наборе данных.
Например, предположим, что профессор сдает экзамен 100 студентам. Она может использовать шкалу, чтобы понять разницу между самым высоким и самым низким баллом, полученным всеми учениками в классе.
И наоборот, нам следует использовать межквартильный диапазон , когда мы хотим понять разницу между 75-м процентилем и 25-м процентилем набора данных.
Например, если профессор проводит экзамен для 100 студентов, он или она может использовать межквартильный диапазон, чтобы быстро понять разницу в экзаменационных баллах между студентом, набравшим 75-й процентиль, и студентом, набравшим 25-й процентиль.
Следует отметить, что нам не нужно выбирать между использованием интервала или межквартильного диапазона для описания распределения значений в наборе данных.
Мы можем использовать обе метрики, поскольку они предоставляют нам совершенно разную информацию.
Обратная сторона использования пляжа
У диапазона есть недостаток: на него влияют выбросы .
Чтобы проиллюстрировать это, рассмотрим следующий набор данных:
Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32.
Диапазон этого набора данных составляет 32 – 1 = 31 .
Однако подумайте, имел ли набор данных экстремальный выброс:
Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378.
Диапазон этого набора данных теперь будет 378 – 1 = 377 .
Обратите внимание, как резко меняется диапазон из-за выброса.
Прежде чем рассчитывать диапазон набора данных, рекомендуется сначала проверить, нет ли каких-либо выбросов, которые могут ввести в заблуждение диапазон.
Дополнительные ресурсы
Следующие руководства предоставляют дополнительную информацию о межквартильном диапазоне:
Как интерпретировать межквартильный размах
Как найти выбросы, используя межквартильный размах
Как рассчитать межквартильный размах в Excel