Что считается хорошим стандартным отклонением?
Стандартное отклонение используется для измерения распределения значений в выборке.
Мы можем использовать следующую формулу для расчета стандартного отклонения данной выборки:
√ Σ(x i – x bar ) 2 / (n-1)
Золото:
- Σ: Символ, означающий «сумма».
- x i : i- е значение выборки
- x bar : Образец означает
- n: Размер выборки
Чем выше значение стандартного отклонения, тем более разбросаны значения в выборке . И наоборот, чем ниже значение стандартного отклонения, тем теснее кластеризуются значения.
Студенты часто задают вопрос: какое значение стандартного отклонения считается хорошим?
Ответ: стандартное отклонение не может быть «хорошим» или «плохим», поскольку оно просто сообщает нам о распределении значений в выборке.
Также не существует универсального числа, позволяющего определить, является ли стандартное отклонение «высоким» или «низким». Например, рассмотрим следующие сценарии:
Сценарий 1: Агент по недвижимости собирает данные о ценах на 100 домов в своем городе и обнаруживает, что стандартное отклонение цен составляет 12 000 долларов.
Сценарий 2 : Экономист измеряет общую сумму подоходного налога, собранного в 50 штатах США, и обнаруживает, что стандартное отклонение общей суммы собранного подоходного налога составляет 480 000 долларов США.
Хотя стандартное отклонение сценария 2 намного выше, чем стандартное отклонение сценария 1, единицы, измеряемые в сценарии 2, намного выше, поскольку общая сумма налогов, собираемых штатами, очевидно, намного выше, чем цены на недвижимость.
Это означает, что не существует единого числа, которое мы могли бы использовать, чтобы определить, является ли стандартное отклонение «хорошим» или «плохим» или даже «высоким» или «низким», поскольку это зависит от ситуации.
Используйте коэффициент вариации
Один из способов определить, велико ли стандартное отклонение, — сравнить его со средним значением набора данных.
Коэффициент вариации , часто сокращенно CV , представляет собой способ измерения разброса значений в наборе данных относительно среднего значения. Он рассчитывается следующим образом:
КВ = с/ х
Золото:
- s: стандартное отклонение набора данных
- x : среднее значение набора данных
Проще говоря, CV — это отношение стандартного отклонения к среднему значению.
Чем выше CV, тем выше стандартное отклонение от среднего значения. В общем, значение CV больше 1 часто считается высоким.
Например, предположим, что агент по недвижимости собирает данные о ценах на 100 домов в своем городе и обнаруживает, что средняя цена составляет 150 000 долларов, а стандартное отклонение цен составляет 12 000 долларов. CV будет рассчитываться следующим образом:
- Резюме: 12 000 долларов США / 150 000 долларов США = 0,08.
Поскольку значение CV намного меньше 1, это говорит нам о том, что стандартное отклонение данных довольно низкое.
И наоборот, предположим, что экономист измеряет общий подоходный налог, собранный в 50 штатах США, и обнаруживает, что среднее значение выборки составляет 400 000 долларов, а стандартное отклонение — 480 000 долларов. CV будет рассчитываться следующим образом:
- Резюме: 480 000 долларов США / 400 000 долларов США = 1,2.
Поскольку это значение CV больше 1, это говорит нам о том, что стандартное отклонение значений данных довольно велико.
Сравнение стандартных отклонений между наборами данных
Мы часто используем стандартное отклонение для измерения распределения значений по разным наборам данных.
Например, предположим, что профессор сдает своим студентам три экзамена в течение семестра. Затем он вычисляет стандартное отклонение баллов для каждого экзамена:
- Пример стандартного отклонения результатов экзамена 1: 4,6
- Пример стандартного отклонения результатов экзамена 2: 12,4.
- Пример стандартного отклонения результатов экзамена 3: 2,3
Это говорит профессору о том, что результаты экзамена были наиболее разбросаны по экзамену 2, а результаты наиболее тесно сгруппированы по экзамену 3.
Дополнительные ресурсы
Стандартное отклонение и стандартная ошибка: в чем разница?
Стандартное отклонение и межквартильный размах: в чем разница?