Як обчислити модифіковані z-оцінки в excel


У статистиці модифікований z-показник обчислюється таким чином:

Модифікований z-показник = 0,6745 (x i – x̃) / MAD

золото:

  • x i : одне значення даних
  • x̃: медіана набору даних
  • MAD: середнє абсолютне відхилення набору даних

Модифікований z-показник надійніший, ніж звичайний z-показник, оскільки він використовує медіану у своїй формулі на відміну від середнього, на яке, як відомо, впливають викиди .

Іглевіч і Хоаглін рекомендують позначати значення з модифікованими z-показниками менше ніж -3,5 або більше ніж 3,5 як потенційні викиди.

У наступному покроковому прикладі показано, як обчислити модифіковані z-показники для заданого набору даних у Excel.

Крок 1: Створіть дані

Спочатку ми створимо такий набір даних, що містить 16 значень:

Крок 2: обчисліть медіану

Далі ми обчислимо медіану набору даних:

Медіана виявляється рівною 16 .

Крок 3: Обчисліть абсолютну різницю між кожним значенням і медіаною

Далі ми обчислимо абсолютну різницю між кожним значенням і медіаною:

Абсолютна різниця між першим значенням даних і медіаною виявляється рівною 16.

Далі клацніть клітинку B2. Потім наведіть курсор на нижній правий кут комірки, доки не з’явиться маленький хрестик ( + ).

Двічі клацніть хрестик, щоб скопіювати та вставити цю формулу в усі інші клітинки стовпця:

Крок 4: Обчисліть абсолютне середнє відхилення

Далі ми використаємо наступну формулу для обчислення середнього абсолютного відхилення набору даних:

Абсолютне медіанне відхилення виявляється рівним 8 .

Крок 5. Знайдіть модифікований Z-показник для кожного значення даних

Нарешті, ми можемо обчислити модифікований z-показник для кожного значення даних за такою формулою:

Модифікований z-показник = 0,6745 (x i – x̃) / MAD

Наприклад, модифікований z-показник для першого значення даних обчислюється таким чином:

Змінений z-показник в Excel

Далі натисніть клітинку C2. Потім наведіть курсор на нижній правий кут комірки, доки не з’явиться маленький хрестик ( + ).

Двічі клацніть хрестик, щоб скопіювати та вставити цю формулу в усі інші клітинки стовпця:

Ми бачимо, що жодне значення в наборі даних не має модифікованого z-показника, меншого за -3,5 або більшого за 3,5, тому ми не позначаємо жодне значення в цьому наборі даних як потенційне викид.

Як працювати з викидами

Якщо у вашому наборі даних присутній викид, у вас є кілька варіантів:

  • Переконайтеся, що викид не є результатом помилки введення даних. Іноді особа просто вводить неправильне значення даних під час збереження даних. Якщо присутній викид, спочатку переконайтеся, що значення введено правильно і що це не помилка.
  • Призначте нове значення викиду . Якщо викид виявляється результатом помилки введення даних, ви можете вирішити призначити йому нове значення, наприклад середнє або медіана набору даних.
  • Видаліть викид. Якщо значення дійсно викидається, ви можете видалити його, якщо воно матиме значний вплив на загальний аналіз. Просто не забудьте зазначити у своєму остаточному звіті чи аналізі, що ви усунули викид.

Додаткові ресурси

Як обчислити Z-оцінки в Excel
Як обчислити міжквартильний діапазон (IQR) в Excel
Як розрахувати середній діапазон в Excel

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *