Диапазон против. стандартное отклонение: когда использовать каждое


Диапазон и стандартное отклонение — это два способа измерения распределения значений в наборе данных.

Диапазон представляет собой разницу между минимальным и максимальным значением в наборе данных.

Стандартное отклонение измеряет типичное отклонение отдельных значений от среднего значения. Он рассчитывается следующим образом:

s = √(Σ(x ix ) 2 / (n-1))

Золото:

  • Σ: Символ, означающий «сумма».
  • x i : значение i-го наблюдения в выборке.
  • x : Образец означает
  • n: Размер выборки

Например, предположим, что у нас есть следующий набор данных:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32.

Диапазон рассчитывается как: 31 -1 = 32.

С помощью калькулятора мы можем определить, что стандартное отклонение равно 9,25.

Диапазон и стандартное отклонение: сходства и различия

Диапазон и стандартное отклонение имеют следующее сходство:

  • Обе метрики измеряют распределение значений в наборе данных.

Однако диапазон и стандартное отклонение имеют следующую разницу:

  • Диапазон показывает нам разницу между наибольшим и наименьшим значением в наборе данных.
  • Стандартное отклонение сообщает нам типичное отклонение отдельных значений от среднего значения набора данных.

Диапазон против. Стандартное отклонение: когда использовать каждое

Нам нужно использовать диапазон , когда мы хотим понять разницу между наибольшим и наименьшим значениями в наборе данных.

Например, предположим, что профессор сдает экзамен 100 студентам. Она может использовать шкалу, чтобы понять разницу между самым высоким и самым низким баллом, полученным всеми учениками в классе.

И наоборот, нам следует использовать стандартное отклонение , когда мы хотим понять, насколько типичное значение набора данных отклоняется от среднего значения.

Например, если профессор проводит экзамен для 100 студентов, он или она может использовать стандартное отклонение, чтобы количественно определить, насколько типичный экзаменационный балл отклоняется от среднего экзаменационного балла.

Стоит отметить, что нам не нужно выбирать между использованием диапазона или стандартного отклонения для описания распределения значений в наборе данных. Мы можем использовать обе метрики, поскольку они предоставляют нам совершенно разную информацию.

Недостатки диапазона и стандартного отклонения

И диапазон, и стандартное отклонение имеют один недостаток: оба они подвержены влиянию выбросов .

Чтобы проиллюстрировать это, рассмотрим следующий набор данных:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32.

Мы можем рассчитать следующие значения диапазона и стандартного отклонения этого набора данных:

  • Диапазон: 31
  • Стандартное отклонение: 9,25

Однако подумайте, имел ли набор данных экстремальный выброс:

Набор данных: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378.

Мы могли бы использовать калькулятор, чтобы найти следующие показатели для этого набора данных:

  • Диапазон: 377
  • Стандартное отклонение: 85,02

Обратите внимание, как существенно изменяются диапазон и стандартное отклонение из-за выброса.

Хотя диапазон и стандартное отклонение могут быть полезными показателями для получения представления о распределении значений в наборе данных, сначала необходимо убедиться, что набор данных не содержит выбросов, влияющих на эти значения. меры. В противном случае диапазон и стандартное отклонение могут ввести в заблуждение.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *