Почему диапазон важен в статистике?


В статистике диапазон представляет собой разницу между наименьшим и наибольшим значением в наборе данных.

Например, предположим, что у нас есть следующий набор данных:

Набор данных: 3, 4, 11, 15, 19, 19, 19, 22, 22, 23, 23, 26.

Для расчета диапазона мы можем использовать следующую формулу:

  • Диапазон = Максимальное значение – Минимальное значение
  • Диапазон = 26 – 3
  • Диапазон = 23

Диапазон составляет 23 . Это представляет собой разницу между наименьшим и наибольшим значениями в наборе данных.

В статистике диапазон важен по следующим причинам:

Причина 1. Это говорит нам о распределении всего набора данных.

Причина 2. Она сообщает нам, какие экстремальные значения возможны в данном наборе данных.

Следующие примеры иллюстрируют каждую из этих причин на практике.

Причина 1: Диапазон говорит нам о распределении всего набора данных.

Диапазон говорит нам о распределении всего набора данных.

Например, предположим, что у нас есть следующий набор данных, который показывает результаты экзаменов 20 разных учеников в классе:

Диапазон результатов экзамена будет рассчитываться следующим образом:

  • Диапазон = Максимальное значение – Минимальное значение
  • Диапазон = 98 – 68
  • Диапазон = 30

Диапазон оказывается 30 . Это разница между самой высокой оценкой на экзамене и самой низкой оценкой в классе.

Точно зная это измерение, классный руководитель может быстро понять распределение значений результатов экзамена среди всех учащихся.

Причина 2: Диапазон говорит нам, какие экстремальные значения возможны в данном наборе данных.

Диапазон говорит нам, какие экстремальные значения возможны в данном наборе данных.

Например, предположим, что агент по недвижимости имеет доступ к базе данных, содержащей цены продажи 100 000 домов в определенном городе США:

Допустим, мы используем статистическое программное обеспечение (например, Excel , R , Python и т. д.) для расчета диапазона этого набора данных и находим следующее:

  • Диапазон = максимальное значение – минимальное значение
  • Диапазон = 854 000 – 194 000
  • Диапазон = 660 000

Если у агента по недвижимости есть клиент, бюджет покупки которого составляет менее 194 000 долларов США или более 854 000 долларов США, агент по недвижимости может сразу узнать, что ни один дом в этом конкретном городе не будет соответствовать критериям покупки.

Обратная сторона использования пляжа

У диапазона есть недостаток: на него влияют выбросы .

Чтобы проиллюстрировать это, рассмотрим следующий набор данных:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32.

Диапазон этого набора данных составляет 32 – 1 = 31 .

Однако подумайте, имел ли набор данных экстремальный выброс:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378.

Диапазон этого набора данных теперь будет 378 – 1 = 377 .

Обратите внимание, как резко меняется диапазон из-за выброса.

Прежде чем рассчитывать диапазон набора данных, рекомендуется сначала проверить, нет ли каких-либо выбросов, которые могут ввести в заблуждение диапазон.

Дополнительные ресурсы

Следующие руководства объясняют важность других показателей в статистике:

Почему среднее значение важно в статистике?
Почему медиана важна в статистике?
Почему режим важен в статистике?
Почему стандартное отклонение важно в статистике?

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *