Как нормализовать данные между -1 и 1


Чтобы нормализовать значения в наборе данных между -1 и 1, вы можете использовать следующую формулу:

z i = 2 * ((x i – x min ) / (x max – x min )) – 1

Золото:

  • z i : i-е нормализованное значение в наборе данных
  • x i : i-е значение набора данных
  • x min : минимальное значение в наборе данных.
  • x max : максимальное значение в наборе данных.

Например, предположим, что у нас есть следующий набор данных:

Минимальное значение в наборе данных — 13, а максимальное — 71.

Чтобы нормализовать первое значение 13 , мы бы применили ранее использованную формулу:

  • z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((13 – 13) / (71 – 13)) – 1 = -1

Чтобы нормализовать второе значение 16 , мы будем использовать ту же формулу:

  • z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((16 – 13) / (71 – 13)) – 1 = -0,897

Чтобы нормализовать третье значение 19 , мы будем использовать ту же формулу:

  • z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((19 – 13) / (71 – 13)) – 1 = -0,793

Мы можем использовать ту же самую формулу для нормализации каждого значения в исходном наборе данных между -1 и 1:

Каждое значение в нормализованном наборе данных теперь находится в диапазоне от -1 до 1.

Используя этот метод нормализации, следующие утверждения всегда будут истинными:

  • Нормализованное значение минимального значения в наборе данных всегда будет равно -1.
  • Нормализованное значение максимального значения в наборе данных всегда будет равно 1.
  • Нормализованные значения для всех остальных значений в наборе данных будут находиться в диапазоне от -1 до 1.

Когда нормализовать данные

Часто мы стандартизируем переменные, когда проводим какой-либо анализ, в котором у нас есть несколько переменных, измеренных в разных масштабах, и мы хотим, чтобы каждая из переменных имела один и тот же диапазон.

Это предотвращает слишком большое влияние одной переменной, особенно если она измеряется в разных единицах измерения (т. е. если одна переменная измеряется в дюймах, а другая в ярдах).

Также обратите внимание, что метод нормализации, который мы использовали здесь, является лишь одним из возможных вариантов.

В некоторых случаях имеет смысл нормализовать переменные между 0 и 1 или даже между 0 и 100.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие типы нормализации:

Как нормализовать данные между 0 и 1
Как нормализовать данные от 0 до 100

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *