Почему диапазон важен в статистике?
В статистике диапазон представляет собой разницу между наименьшим и наибольшим значением в наборе данных.
Например, предположим, что у нас есть следующий набор данных:
Набор данных: 3, 4, 11, 15, 19, 19, 19, 22, 22, 23, 23, 26.
Для расчета диапазона мы можем использовать следующую формулу:
- Диапазон = Максимальное значение – Минимальное значение
- Диапазон = 26 – 3
- Диапазон = 23
Диапазон составляет 23 . Это представляет собой разницу между наименьшим и наибольшим значениями в наборе данных.
В статистике диапазон важен по следующим причинам:
Причина 1. Это говорит нам о распределении всего набора данных.
Причина 2. Она сообщает нам, какие экстремальные значения возможны в данном наборе данных.
Следующие примеры иллюстрируют каждую из этих причин на практике.
Причина 1: Диапазон говорит нам о распределении всего набора данных.
Диапазон говорит нам о распределении всего набора данных.
Например, предположим, что у нас есть следующий набор данных, который показывает результаты экзаменов 20 разных учеников в классе:
Диапазон результатов экзамена будет рассчитываться следующим образом:
- Диапазон = Максимальное значение – Минимальное значение
- Диапазон = 98 – 68
- Диапазон = 30
Диапазон оказывается 30 . Это разница между самой высокой оценкой на экзамене и самой низкой оценкой в классе.
Точно зная это измерение, классный руководитель может быстро понять распределение значений результатов экзамена среди всех учащихся.
Причина 2: Диапазон говорит нам, какие экстремальные значения возможны в данном наборе данных.
Диапазон говорит нам, какие экстремальные значения возможны в данном наборе данных.
Например, предположим, что агент по недвижимости имеет доступ к базе данных, содержащей цены продажи 100 000 домов в определенном городе США:
Допустим, мы используем статистическое программное обеспечение (например, Excel , R , Python и т. д.) для расчета диапазона этого набора данных и находим следующее:
- Диапазон = максимальное значение – минимальное значение
- Диапазон = 854 000 – 194 000
- Диапазон = 660 000
Если у агента по недвижимости есть клиент, бюджет покупки которого составляет менее 194 000 долларов США или более 854 000 долларов США, агент по недвижимости может сразу узнать, что ни один дом в этом конкретном городе не будет соответствовать критериям покупки.
Обратная сторона использования пляжа
У диапазона есть недостаток: на него влияют выбросы .
Чтобы проиллюстрировать это, рассмотрим следующий набор данных:
Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32.
Диапазон этого набора данных составляет 32 – 1 = 31 .
Однако подумайте, имел ли набор данных экстремальный выброс:
Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378.
Диапазон этого набора данных теперь будет 378 – 1 = 377 .
Обратите внимание, как резко меняется диапазон из-за выброса.
Прежде чем рассчитывать диапазон набора данных, рекомендуется сначала проверить, нет ли каких-либо выбросов, которые могут ввести в заблуждение диапазон.
Дополнительные ресурсы
Следующие руководства объясняют важность других показателей в статистике:
Почему среднее значение важно в статистике?
Почему медиана важна в статистике?
Почему режим важен в статистике?
Почему стандартное отклонение важно в статистике?