Чому діапазон важливий у статистиці?
У статистиці діапазон представляє різницю між найменшим і найбільшим значенням у наборі даних.
Наприклад, припустимо, що ми маємо такий набір даних:
Набір даних: 3, 4, 11, 15, 19, 19, 19, 22, 22, 23, 23, 26
Щоб обчислити діапазон, ми можемо використати таку формулу:
- Діапазон = Максимальне значення – Мінімальне значення
- Діапазон = 26 – 3
- Діапазон = 23
Діапазон 23 . Це різниця між найменшим і найбільшим значеннями в наборі даних.
У статистиці діапазон важливий з таких причин:
Причина 1 : це повідомляє нам про розподіл усього набору даних.
Причина 2 : це говорить нам, які екстремальні значення можливі в певному наборі даних.
Наступні приклади ілюструють кожну з цих причин на практиці.
Причина 1: Діапазон повідомляє нам розподіл усього набору даних
Діапазон повідомляє нам розподіл усього набору даних.
Наприклад, припустімо, що ми маємо такий набір даних, який показує результати іспитів 20 різних студентів у класі:
Діапазон результатів іспиту розраховуватиметься таким чином:
- Діапазон = Максимальне значення – Мінімальне значення
- Діапазон = 98 – 68
- Діапазон = 30
Діапазон виявляється 30 . Це різниця між найвищою оцінкою на іспиті та найнижчою оцінкою в класі.
Точно знаючи це вимірювання, класний керівник може швидко зрозуміти розподіл значень результатів іспиту серед усіх студентів.
Причина 2: Діапазон повідомляє нам, які екстремальні значення можливі в даному наборі даних
Діапазон повідомляє нам, які екстремальні значення можливі в даному наборі даних.
Наприклад, припустимо, що агент з нерухомості має доступ до бази даних, що містить ціни продажу 100 000 будинків у певному місті Сполучених Штатів:
Припустімо, ми використовуємо статистичне програмне забезпечення (наприклад, Excel , R , Python тощо), щоб обчислити діапазон цього набору даних і знайти наступне:
- Діапазон = максимальне значення – мінімальне значення
- Діапазон = 854 000 – 194 000
- Діапазон = 660 000
Якщо агент з нерухомості має клієнта, бюджет покупки якого становить менше 194 000 доларів США або перевищує 854 000 доларів США, агент з нерухомості може відразу знати, що жоден будинок у цьому конкретному місті не відповідатиме критеріям для покупки.
Недолік використання пляжу
Діапазон має недолік: на нього впливають викиди .
Щоб проілюструвати це, розглянемо наступний набір даних:
Набір даних: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Діапазон цього набору даних становить 32 – 1 = 31 .
Однак подумайте, чи має набір даних екстремальний викид:
Набір даних: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
Діапазон цього набору даних тепер буде 378 – 1 = 377 .
Зверніть увагу, як різко змінюється діапазон через викид.
Перш ніж обчислювати діапазон набору даних, доцільно спочатку перевірити, чи немає викидів, які можуть ввести діапазон в оману.
Додаткові ресурси
Наступні навчальні посібники пояснюють важливість інших показників у статистиці:
Чому середня величина важлива в статистиці?
Чому медіана важлива в статистиці?
Чому режим важливий у статистиці?
Чому стандартне відхилення є важливим у статистиці?