Интервал против. межквартильный размах: в чем разница?


В статистике интервал и межквартильный размах — это два способа измерения распределения значений в наборе данных.

Диапазон измеряет разницу между минимальным и максимальным значением в наборе данных.

Межквартильный диапазон измеряет разницу между первым квартилем (25-й процентиль) и третьим квартилем (75-й процентиль) в наборе данных. Это представляет собой распределение средних 50% значений.

Пример: Как рассчитать интервал и межквартильный размах

Предположим, у нас есть следующий набор данных:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32.

Для расчета диапазона мы можем использовать следующие шаги:

  • Диапазон = Максимальное значение – Минимальное значение
  • Диапазон = 32 – 1
  • Диапазон = 31

Мы можем использовать калькулятор межквартильного диапазона, чтобы рассчитать межквартильный диапазон :

  • Межквартильная шкала = 3-й квартиль – 1-й квартиль
  • Интерквартильная шкала = 26,5 – 12
  • Межквартильный размах = 14,5

Диапазон говорит нам о распределении набора данных, а межквартильный диапазон говорит нам о распределении средней половины набора данных.

интервал против межквартильного размаха

Диапазон и межквартильный размах: сходства и различия

Интервал и межквартильный размах имеют следующее сходство:

  • Обе метрики измеряют распределение значений в наборе данных.

Однако интервал и межквартильный размах имеют следующее отличие:

  • Диапазон показывает нам разницу между наибольшим и наименьшим значением в наборе данных.
  • Межквартильный диапазон говорит нам о распределении средних 50% значений в наборе данных.

Интервал и межквартильный диапазон: когда использовать каждый

Нам нужно использовать диапазон , когда мы хотим понять разницу между наибольшим и наименьшим значениями в наборе данных.

Например, предположим, что профессор сдает экзамен 100 студентам. Она может использовать шкалу, чтобы понять разницу между самым высоким и самым низким баллом, полученным всеми учениками в классе.

И наоборот, нам следует использовать межквартильный диапазон , когда мы хотим понять разницу между 75-м процентилем и 25-м процентилем набора данных.

Например, если профессор проводит экзамен для 100 студентов, он или она может использовать межквартильный диапазон, чтобы быстро понять разницу в экзаменационных баллах между студентом, набравшим 75-й процентиль, и студентом, набравшим 25-й процентиль.

Следует отметить, что нам не нужно выбирать между использованием интервала или межквартильного диапазона для описания распределения значений в наборе данных.

Мы можем использовать обе метрики, поскольку они предоставляют нам совершенно разную информацию.

Обратная сторона использования пляжа

У диапазона есть недостаток: на него влияют выбросы .

Чтобы проиллюстрировать это, рассмотрим следующий набор данных:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32.

Диапазон этого набора данных составляет 32 – 1 = 31 .

Однако подумайте, имел ли набор данных экстремальный выброс:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378.

Диапазон этого набора данных теперь будет 378 – 1 = 377 .

Обратите внимание, как резко меняется диапазон из-за выброса.

Прежде чем рассчитывать диапазон набора данных, рекомендуется сначала проверить, нет ли каких-либо выбросов, которые могут ввести в заблуждение диапазон.

Дополнительные ресурсы

Следующие руководства предоставляют дополнительную информацию о межквартильном диапазоне:

Как интерпретировать межквартильный размах
Как найти выбросы, используя межквартильный размах
Как рассчитать межквартильный размах в Excel

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *