Діапазон проти стандартне відхилення: коли використовувати кожне
Діапазон і стандартне відхилення – це два способи вимірювання розподілу значень у наборі даних.
Діапазон представляє різницю між мінімальним і максимальним значенням у наборі даних.
Стандартне відхилення вимірює типове відхилення індивідуальних значень від середнього значення. Він розраховується таким чином:
s = √(Σ(x i – x ) 2 / (n-1))
золото:
- Σ: символ, що означає «сума»
- x i : значення i-го спостереження у вибірці
- x : вибірка означає
- n: розмір вибірки
Наприклад, припустимо, що ми маємо такий набір даних:
Набір даних: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Діапазон обчислюється так: 31 -1 = 32.
Ми можемо скористатися калькулятором, щоб знайти стандартне відхилення 9,25.
Діапазон і стандартне відхилення: подібності та відмінності
Діапазон і стандартне відхилення мають таку схожість:
- Обидва показники вимірюють розподіл значень у наборі даних.
Однак діапазон і стандартне відхилення мають такі відмінності:
- Діапазон показує нам різницю між найбільшим і найменшим значенням у наборі даних.
- Стандартне відхилення говорить нам про типове відхилення окремих значень від середнього значення набору даних.
Діапазон проти Стандартне відхилення: коли використовувати кожне
Нам потрібно використовувати діапазон , коли ми хочемо зрозуміти різницю між найбільшим і найменшим значенням у наборі даних.
Наприклад, припустимо, що професор дає іспит 100 студентам. Вона може використовувати шкалу, щоб зрозуміти різницю між найвищим і найнижчим балом, отриманим усіма учнями в класі.
І навпаки, ми повинні використовувати стандартне відхилення , коли хочемо зрозуміти, наскільки типове значення набору даних відхиляється від середнього значення.
Наприклад, якщо професор проводить іспит для 100 студентів, він або вона може використовувати стандартне відхилення, щоб кількісно визначити, наскільки типовий іспитовий бал відхиляється від середнього іспитового балу.
Варто зазначити, що нам не потрібно вибирати між використанням діапазону чи стандартного відхилення для опису розподілу значень у наборі даних. Ми можемо використовувати обидва показники, оскільки вони надають нам абсолютно різну інформацію.
Недоліки діапазону та стандартного відхилення
І діапазон, і стандартне відхилення мають недолік: на них впливають викиди .
Щоб проілюструвати це, розглянемо наступний набір даних:
Набір даних: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Ми можемо обчислити такі значення для діапазону та стандартного відхилення цього набору даних:
- Діапазон: 31
- Стандартне відхилення: 9,25
Однак подумайте, чи має набір даних екстремальний викид:
Набір даних: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
Ми могли б скористатися калькулятором, щоб знайти такі показники для цього набору даних:
- Діапазон: 377
- Стандартне відхилення: 85,02
Зверніть увагу, як діапазон і стандартне відхилення значно змінюються через викид.
Хоча діапазон і стандартне відхилення можуть бути корисними показниками для отримання уявлення про розподіл значень у наборі даних, ви повинні спочатку переконатися, що набір даних не містить жодних викидів, які впливають на ці значення. заходів. Інакше діапазон і стандартне відхилення можуть ввести в оману.