Нормализация z-оценки: определение и примеры
Нормализация Z-показателя относится к процессу нормализации каждого значения в наборе данных таким образом, чтобы среднее значение всех значений было равно 0, а стандартное отклонение равно 1.
Мы используем следующую формулу для нормализации z-показателя для каждого значения в наборе данных:
Новое значение = (x – µ) / σ
Золото:
- x : Исходное значение
- μ : Среднее значение данных
- σ : Стандартное отклонение данных.
В следующем примере показано, как на практике выполнить нормализацию z-показателя набора данных.
Пример: выполнение нормализации Z-показателя
Предположим, у нас есть следующий набор данных:
Используя калькулятор, мы видим, что среднее значение набора данных составляет 21,2 , а стандартное отклонение — 29,8 .
Чтобы выполнить нормализацию z-показателя к первому значению в наборе данных, мы можем использовать следующую формулу:
- Новое значение = (x – µ) / σ
- Новое значение = (3 – 21,2) / 29,8.
- Новое значение = -0,61.
Мы можем использовать эту формулу для нормализации z-показателя для каждого значения в наборе данных:
Среднее значение нормализованных значений равно 0 , а стандартное отклонение нормализованных значений равно 1 .
Нормализованные значения представляют собой количество стандартных отклонений между исходным значением и средним значением.
Например:
- Первое значение в наборе данных на 0,61 стандартного отклонения ниже среднего.
- Второе значение в наборе данных на 0,54 стандартного отклонения ниже среднего.
- …
- Последнее значение в наборе данных на 3,79 стандартных отклонения выше среднего.
Преимущество выполнения этого типа нормализации заключается в том, что очевидный выброс в наборе данных (134) был преобразован таким образом, что он больше не является значительным выбросом.
Если мы затем используем этот набор данных для соответствия некоторому типу модели машинного обучения , выброс больше не будет иметь такого большого влияния, как он мог бы оказать на подгонку модели.
Дополнительные ресурсы
Следующие руководства предоставляют дополнительную информацию о различных методах нормализации:
Стандартизация или нормализация: в чем разница?
Как нормализовать данные между 0 и 1
Как нормализовать данные от 0 до 100