Що вважається хорошим стандартним відхиленням?


Стандартне відхилення використовується для вимірювання розподілу значень у вибірці.

Ми можемо використати таку формулу, щоб обчислити стандартне відхилення заданої вибірки:

Σ(x i – x bar ) 2 / (n-1)

золото:

  • Σ: символ, що означає «сума»
  • x i : i-те значення вибірки
  • x bar : Зразок означає
  • n: розмір вибірки

Чим вище значення стандартного відхилення, тим більше розсіяні значення у вибірці . І навпаки, чим менше значення стандартного відхилення, тим тісніше кластеризовані значення.

Питання, яке студенти часто задають: що вважається хорошим значенням стандартного відхилення?

Відповідь: стандартне відхилення не може бути «хорошим» або «поганим», оскільки воно просто повідомляє нам про розподіл значень у вибірці.

Також не існує універсального числа для визначення того, чи є стандартне відхилення «високим» чи «низьким». Наприклад, розглянемо такі сценарії:

Сценарій 1. Агент з нерухомості збирає дані про ціни на 100 будинків у своєму місті та виявляє, що стандартне відхилення цін становить 12 000 доларів США.

Сценарій 2 : Економіст вимірює загальний податок на прибуток, зібраний у 50 штатах Сполучених Штатів, і виявляє, що стандартне відхилення загального зібраного податку на прибуток становить 480 000 доларів США.

Хоча стандартне відхилення сценарію 2 є набагато вищим, ніж стандартне відхилення сценарію 1, одиниці, виміряні у сценарії 2, є набагато вищими, оскільки загальна сума податків, зібраних штатами, очевидно, значно перевищує ціни на нерухомість.

Це означає, що немає єдиного числа, яке ми можемо використати, щоб визначити, чи є стандартне відхилення «хорошим» чи «поганим», чи навіть «високим» чи «низьким», оскільки це залежить від ситуації.

Використовуйте коефіцієнт варіації

Один із способів визначити, чи є стандартне відхилення високим, — порівняти його із середнім значенням набору даних.

Коефіцієнт варіації , який часто називають CV , є способом вимірювання розкиду значень у наборі даних відносно середнього. Він розраховується таким чином:

CV = s/ x

золото:

  • s: стандартне відхилення набору даних
  • x : середнє значення набору даних

Простіше кажучи, CV – це відношення стандартного відхилення до середнього.

Чим вище CV, тим вище стандартне відхилення від середнього. Загалом, значення CV більше 1 часто вважається високим.

Наприклад, припустімо, що агент з нерухомості збирає дані про ціни на 100 будинків у своєму місті та знаходить, що середня ціна становить 150 000 доларів США, а стандартне відхилення цін – 12 000 доларів. Резюме буде розраховано таким чином:

  • CV: $12 000 / $150 000 = 0,08

Оскільки це значення CV набагато менше 1, це говорить нам про те, що стандартне відхилення даних досить низьке.

І навпаки, припустімо, що економіст вимірює загальний податок на прибуток, зібраний у 50 штатах Сполучених Штатів, і виявить, що середнє значення вибірки становить 400 000 доларів США, а стандартне відхилення – 480 000 доларів США. Резюме буде розраховано таким чином:

  • CV: $480 000 / $400 000 = 1,2

Оскільки це значення CV більше 1, це говорить нам про те, що стандартне відхилення значень даних є досить високим.

Порівняння стандартних відхилень між наборами даних

Ми часто використовуємо стандартне відхилення для вимірювання розподілу значень між різними наборами даних.

Наприклад, припустимо, що професор ставить своїм студентам три іспити протягом семестру. Потім він обчислює стандартне відхилення балів для кожного іспиту:

  • Приклад стандартного відхилення результатів іспиту 1: 4,6
  • Приклад стандартного відхилення результатів іспиту 2: 12.4
  • Приклад стандартного відхилення результатів іспиту 3: 2.3

Це повідомляє професору, що результати іспиту були найбільш розкиданими для іспиту 2, тоді як результати були найбільш тісно згруповані для іспиту 3.

Додаткові ресурси

Стандартне відхилення та стандартна помилка: у чому різниця?
Стандартне відхилення проти інтерквартильного діапазону: у чому різниця?

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *