Емпіричне правило діапазону: визначення та приклад
Емпіричне правило діапазону забезпечує швидкий і простий спосіб оцінити стандартне відхилення набору даних за такою формулою:
Стандартне відхилення = діапазон / 4
Це емпіричне правило іноді використовується, оскільки воно дозволяє оцінити стандартне відхилення набору даних, просто використовуючи два значення (мінімальне значення та максимальне значення) замість кожного значення.
Приклад: емпіричне правило діапазону
Припустімо, що ми маємо такий набір даних із 20 значень:
4, 5, 5, 8, 13, 14, 16, 18, 22, 24, 26, 28, 30, 31, 31, 34, 36, 38, 39, 39
Фактичне стандартне відхилення цих значень становить 11,681 .
Використовуючи емпіричне правило для діапазонів, ми б оцінили стандартне відхилення як (39-4)/4 = 8,75 . Це значення дещо близько до фактичного стандартного відхилення.
Застереження щодо використання емпіричного правила діапазону
Очевидна перевага емпіричного правила для відстаней полягає в тому, що його неймовірно просто і швидко обчислити. Все, що нам потрібно знати, це мінімальне та максимальне значення набору даних.
Недоліком емпіричного правила для діапазонів є те, що воно, як правило, добре працює лише тоді, коли дані надходять із нормального розподілу , а розмір вибірки становить близько 30. Якщо ці умови не виконуються, емпіричне правило не працює добре. .
Альтернатива емпіричному правилу діапазону
У статті 2012 року в журналі Rose-Hulman Undergraduate Mathematics Journal Рамірес і Кокс запропонували використовувати таку формулу як покращення емпіричного правила:
Стандартне відхилення = діапазон / (3√(ln (n) )-1,5)
де n – розмір вибірки.
Розглянемо той самий набір даних, який ми використовували раніше:
4, 5, 5, 8, 13, 14, 16, 18, 22, 24, 26, 28, 30, 31, 31, 34, 36, 38, 39, 39
Використовуючи цю формулу, ми обчислимо стандартне відхилення як 35/ (3√(ln(20))-1,5) = 9,479 . Це значення ближче до фактичного стандартного відхилення 11,681 порівняно з емпіричною оцінкою 8,75 .
Цю формулу трохи складніше обчислити, ніж емпіричне правило, але вона, як правило, забезпечує точнішу оцінку стандартного відхилення, коли дані не походять із нормального розподілу або коли розмір вибірки не наближається до 30. .
Додаткові ресурси
Експертний калькулятор діапазону
Міри дисперсії: визначення та приклади