Нормализация z-оценки: определение и примеры


Нормализация Z-показателя относится к процессу нормализации каждого значения в наборе данных таким образом, чтобы среднее значение всех значений было равно 0, а стандартное отклонение равно 1.

Мы используем следующую формулу для нормализации z-показателя для каждого значения в наборе данных:

Новое значение = (x – µ) / σ

Золото:

  • x : Исходное значение
  • μ : Среднее значение данных
  • σ : Стандартное отклонение данных.

В следующем примере показано, как на практике выполнить нормализацию z-показателя набора данных.

Пример: выполнение нормализации Z-показателя

Предположим, у нас есть следующий набор данных:

Используя калькулятор, мы видим, что среднее значение набора данных составляет 21,2 , а стандартное отклонение — 29,8 .

Чтобы выполнить нормализацию z-показателя к первому значению в наборе данных, мы можем использовать следующую формулу:

  • Новое значение = (x – µ) / σ
  • Новое значение = (3 – 21,2) / 29,8.
  • Новое значение = -0,61.

Мы можем использовать эту формулу для нормализации z-показателя для каждого значения в наборе данных:

Среднее значение нормализованных значений равно 0 , а стандартное отклонение нормализованных значений равно 1 .

Нормализованные значения представляют собой количество стандартных отклонений между исходным значением и средним значением.

Например:

  • Первое значение в наборе данных на 0,61 стандартного отклонения ниже среднего.
  • Второе значение в наборе данных на 0,54 стандартного отклонения ниже среднего.
  • Последнее значение в наборе данных на 3,79 стандартных отклонения выше среднего.

Преимущество выполнения этого типа нормализации заключается в том, что очевидный выброс в наборе данных (134) был преобразован таким образом, что он больше не является значительным выбросом.

Если мы затем используем этот набор данных для соответствия некоторому типу модели машинного обучения , выброс больше не будет иметь такого большого влияния, как он мог бы оказать на подгонку модели.

Дополнительные ресурсы

Следующие руководства предоставляют дополнительную информацию о различных методах нормализации:

Стандартизация или нормализация: в чем разница?
Как нормализовать данные между 0 и 1
Как нормализовать данные от 0 до 100

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *