Как рассчитать модифицированные z-показатели в excel


В статистике модифицированный z-показатель рассчитывается следующим образом:

Модифицированный z-показатель = 0,6745 (x i – x̃) / MAD

Золото:

  • x i : одно значение данных
  • x̃: медиана набора данных
  • MAD: медианное абсолютное отклонение набора данных.

Модифицированный z-показатель более надежен, чем обычный z-показатель, поскольку в его формуле используется медиана, а не среднее значение, на которое, как известно, влияют выбросы .

Иглевич и Хоаглин рекомендуют помечать значения с модифицированными z-показателями менее -3,5 или более 3,5 как потенциальные выбросы.

В следующем пошаговом примере показано, как рассчитать модифицированные z-показатели для заданного набора данных в Excel.

Шаг 1. Создайте данные

Сначала мы создадим следующий набор данных, содержащий 16 значений:

Шаг 2. Рассчитайте медиану

Далее мы рассчитаем медиану набора данных:

Медиана оказывается 16 .

Шаг 3. Рассчитайте абсолютную разницу между каждым значением и медианой.

Далее мы рассчитаем абсолютную разницу между каждым значением и медианой:

Абсолютная разница между первым значением данных и медианой оказывается равной 16.

Затем щелкните ячейку B2. Затем наведите указатель мыши на правый нижний угол ячейки, пока не появится маленький крестик ( + ).

Дважды щелкните крестик, чтобы скопировать и вставить эту формулу во все оставшиеся ячейки столбца:

Шаг 4. Рассчитайте абсолютное медианное отклонение.

Далее мы будем использовать следующую формулу для расчета медианного абсолютного отклонения набора данных:

Абсолютное медианное отклонение оказывается равным 8 .

Шаг 5. Найдите модифицированный Z-показатель для каждого значения данных.

Наконец, мы можем рассчитать модифицированный z-показатель для каждого значения данных, используя следующую формулу:

Модифицированный z-показатель = 0,6745 (x i – x̃) / MAD

Например, модифицированный z-показатель для первого значения данных рассчитывается следующим образом:

Модифицированный z-показатель в Excel

Затем нажмите на ячейку C2. Затем наведите указатель мыши на правый нижний угол ячейки, пока не появится маленький крестик ( + ).

Дважды щелкните крестик, чтобы скопировать и вставить эту формулу во все оставшиеся ячейки столбца:

Мы видим, что ни одно значение в наборе данных не имеет модифицированного z-показателя ниже -3,5 или выше 3,5, поэтому мы не помечаем какое-либо значение в этом наборе данных как потенциальное выброс.

Как обрабатывать выбросы

Если в вашем наборе данных присутствует выброс, у вас есть несколько вариантов:

  • Убедитесь, что выброс не является результатом ошибки ввода данных. Иногда человек просто вводит неправильное значение данных при сохранении данных. Если присутствует выброс, сначала убедитесь, что значение введено правильно и не является ошибкой.
  • Присвойте новое значение выбросу . Если выброс окажется результатом ошибки ввода данных, вы можете присвоить ему новое значение, например среднее значение или медиану набора данных.
  • Удалите выброс. Если значение действительно является выбросом, вы можете удалить его, если оно окажет существенное влияние на общий анализ. Просто не забудьте упомянуть в своем итоговом отчете или анализе, что вы удалили выбросы.

Дополнительные ресурсы

Как рассчитать Z-баллы в Excel
Как рассчитать межквартильный размах (IQR) в Excel
Как рассчитать средний диапазон в Excel

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *