Чому діапазон важливий у статистиці?


У статистиці діапазон представляє різницю між найменшим і найбільшим значенням у наборі даних.

Наприклад, припустимо, що ми маємо такий набір даних:

Набір даних: 3, 4, 11, 15, 19, 19, 19, 22, 22, 23, 23, 26

Щоб обчислити діапазон, ми можемо використати таку формулу:

  • Діапазон = Максимальне значення – Мінімальне значення
  • Діапазон = 26 – 3
  • Діапазон = 23

Діапазон 23 . Це різниця між найменшим і найбільшим значеннями в наборі даних.

У статистиці діапазон важливий з таких причин:

Причина 1 : це повідомляє нам про розподіл усього набору даних.

Причина 2 : це говорить нам, які екстремальні значення можливі в певному наборі даних.

Наступні приклади ілюструють кожну з цих причин на практиці.

Причина 1: Діапазон повідомляє нам розподіл усього набору даних

Діапазон повідомляє нам розподіл усього набору даних.

Наприклад, припустімо, що ми маємо такий набір даних, який показує результати іспитів 20 різних студентів у класі:

Діапазон результатів іспиту розраховуватиметься таким чином:

  • Діапазон = Максимальне значення – Мінімальне значення
  • Діапазон = 98 – 68
  • Діапазон = 30

Діапазон виявляється 30 . Це різниця між найвищою оцінкою на іспиті та найнижчою оцінкою в класі.

Точно знаючи це вимірювання, класний керівник може швидко зрозуміти розподіл значень результатів іспиту серед усіх студентів.

Причина 2: Діапазон повідомляє нам, які екстремальні значення можливі в даному наборі даних

Діапазон повідомляє нам, які екстремальні значення можливі в даному наборі даних.

Наприклад, припустимо, що агент з нерухомості має доступ до бази даних, що містить ціни продажу 100 000 будинків у певному місті Сполучених Штатів:

Припустімо, ми використовуємо статистичне програмне забезпечення (наприклад, Excel , R , Python тощо), щоб обчислити діапазон цього набору даних і знайти наступне:

  • Діапазон = максимальне значення – мінімальне значення
  • Діапазон = 854 000 – 194 000
  • Діапазон = 660 000

Якщо агент з нерухомості має клієнта, бюджет покупки якого становить менше 194 000 доларів США або перевищує 854 000 доларів США, агент з нерухомості може відразу знати, що жоден будинок у цьому конкретному місті не відповідатиме критеріям для покупки.

Недолік використання пляжу

Діапазон має недолік: на нього впливають викиди .

Щоб проілюструвати це, розглянемо наступний набір даних:

Набір даних: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Діапазон цього набору даних становить 32 – 1 = 31 .

Однак подумайте, чи має набір даних екстремальний викид:

Набір даних: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

Діапазон цього набору даних тепер буде 378 – 1 = 377 .

Зверніть увагу, як різко змінюється діапазон через викид.

Перш ніж обчислювати діапазон набору даних, доцільно спочатку перевірити, чи немає викидів, які можуть ввести діапазон в оману.

Додаткові ресурси

Наступні навчальні посібники пояснюють важливість інших показників у статистиці:

Чому середня величина важлива в статистиці?
Чому медіана важлива в статистиці?
Чому режим важливий у статистиці?
Чому стандартне відхилення є важливим у статистиці?

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *