Як обчислити модифіковані z-оцінки в excel
У статистиці модифікований z-показник обчислюється таким чином:
Модифікований z-показник = 0,6745 (x i – x̃) / MAD
золото:
- x i : одне значення даних
- x̃: медіана набору даних
- MAD: середнє абсолютне відхилення набору даних
Модифікований z-показник надійніший, ніж звичайний z-показник, оскільки він використовує медіану у своїй формулі на відміну від середнього, на яке, як відомо, впливають викиди .
Іглевіч і Хоаглін рекомендують позначати значення з модифікованими z-показниками менше ніж -3,5 або більше ніж 3,5 як потенційні викиди.
У наступному покроковому прикладі показано, як обчислити модифіковані z-показники для заданого набору даних у Excel.
Крок 1: Створіть дані
Спочатку ми створимо такий набір даних, що містить 16 значень:
Крок 2: обчисліть медіану
Далі ми обчислимо медіану набору даних:
Медіана виявляється рівною 16 .
Крок 3: Обчисліть абсолютну різницю між кожним значенням і медіаною
Далі ми обчислимо абсолютну різницю між кожним значенням і медіаною:
Абсолютна різниця між першим значенням даних і медіаною виявляється рівною 16.
Далі клацніть клітинку B2. Потім наведіть курсор на нижній правий кут комірки, доки не з’явиться маленький хрестик ( + ).
Двічі клацніть хрестик, щоб скопіювати та вставити цю формулу в усі інші клітинки стовпця:
Крок 4: Обчисліть абсолютне середнє відхилення
Далі ми використаємо наступну формулу для обчислення середнього абсолютного відхилення набору даних:
Абсолютне медіанне відхилення виявляється рівним 8 .
Крок 5. Знайдіть модифікований Z-показник для кожного значення даних
Нарешті, ми можемо обчислити модифікований z-показник для кожного значення даних за такою формулою:
Модифікований z-показник = 0,6745 (x i – x̃) / MAD
Наприклад, модифікований z-показник для першого значення даних обчислюється таким чином:
Далі натисніть клітинку C2. Потім наведіть курсор на нижній правий кут комірки, доки не з’явиться маленький хрестик ( + ).
Двічі клацніть хрестик, щоб скопіювати та вставити цю формулу в усі інші клітинки стовпця:
Ми бачимо, що жодне значення в наборі даних не має модифікованого z-показника, меншого за -3,5 або більшого за 3,5, тому ми не позначаємо жодне значення в цьому наборі даних як потенційне викид.
Як працювати з викидами
Якщо у вашому наборі даних присутній викид, у вас є кілька варіантів:
- Переконайтеся, що викид не є результатом помилки введення даних. Іноді особа просто вводить неправильне значення даних під час збереження даних. Якщо присутній викид, спочатку переконайтеся, що значення введено правильно і що це не помилка.
- Призначте нове значення викиду . Якщо викид виявляється результатом помилки введення даних, ви можете вирішити призначити йому нове значення, наприклад середнє або медіана набору даних.
- Видаліть викид. Якщо значення дійсно викидається, ви можете видалити його, якщо воно матиме значний вплив на загальний аналіз. Просто не забудьте зазначити у своєму остаточному звіті чи аналізі, що ви усунули викид.
Додаткові ресурси
Як обчислити Z-оцінки в Excel
Як обчислити міжквартильний діапазон (IQR) в Excel
Як розрахувати середній діапазон в Excel