Як інтерпретувати інтерквартильний діапазон: із прикладами
Міжквартильний діапазон набору даних, часто скорочено IQR, є різницею між першим квартилем (25-й процентиль) і третім квартилем (75-й процентиль) набору даних.
Простіше кажучи, він вимірює відхилення між середніми 50% значень.
IQR = Q3 – Q1
Наприклад, припустімо, що ми маємо такий набір даних, який показує висоту 17 різних рослин (у дюймах) у лабораторії:
Набір даних: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Згідно з калькулятором інтерквартильного діапазону, інтерквартильний діапазон (IQR) для цього набору даних обчислюється таким чином:
- Т1: 12
- Т3: 26,5
- IQR = Q3 – Q1 = 14,5
Це говорить нам про те, що середні 50% значень у наборі даних мають розкид 14,5 дюйма.
Чому міжквартильний діапазон корисний
Міжквартильний діапазон є одним із способів вимірювання розподілу значень у наборі даних, але існують і інші міри розподілу, такі як:
- Діапазон: вимірює різницю між мінімальним і максимальним значенням у наборі даних.
- Стандартне відхилення: вимірює типове відхилення окремих значень від середнього значення в наборі даних.
Перевага використання інтерквартильного діапазону (IQR) для вимірювання розподілу значень у наборі даних полягає в тому, що на нього не впливають екстремальні викиди.
Наприклад, надзвичайно мале або надзвичайно велике значення в наборі даних не вплине на обчислення IQR, оскільки IQR використовує лише значення 25-го процентиля та 75-го процентиля набору даних.
Щоб проілюструвати це, розглянемо наступний набір даних:
Набір даних: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Цей набір даних має такі вимірювання поширення
- IQR: 14,5
- Стандартне відхилення: 9,25
- Діапазон: 31
Однак подумайте, чи має набір даних екстремальний викид:
Набір даних: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
Ми могли б скористатися калькулятором, щоб знайти такі вимірювання поширення для цього набору даних:
- IQR: 15
- Стандартне відхилення: 85,02
- Діапазон: 377
Зауважте, що інтерквартильний діапазон майже не змінюється, коли присутній викид, тоді як стандартне відхилення та діапазон різко змінюються.
Порівняння інтерквартильних діапазонів між наборами даних
Міжквартильний діапазон також можна використовувати для порівняння розподілу значень між різними наборами даних.
Наприклад, припустімо, що у нас є три набори даних із такими значеннями IQR:
- IQR набору даних 1: 13,5
- IQR набору даних 2: 24,4
- Набір даних 3 IQR: 8.7
Це говорить нам про те, що розрив між середніми 50% значень найбільший для набору даних 2 і найменший для набору даних 3.
Додаткові ресурси
Як обчислити інтерквартильний діапазон в Excel
Як обчислити інтерквартильний діапазон у Python
Як знайти викиди за допомогою інтерквартильного діапазону
Калькулятор інтерквартильного діапазону