Как нормализовать данные между -1 и 1
Чтобы нормализовать значения в наборе данных между -1 и 1, вы можете использовать следующую формулу:
z i = 2 * ((x i – x min ) / (x max – x min )) – 1
Золото:
- z i : i-е нормализованное значение в наборе данных
- x i : i-е значение набора данных
- x min : минимальное значение в наборе данных.
- x max : максимальное значение в наборе данных.
Например, предположим, что у нас есть следующий набор данных:
Минимальное значение в наборе данных — 13, а максимальное — 71.
Чтобы нормализовать первое значение 13 , мы бы применили ранее использованную формулу:
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((13 – 13) / (71 – 13)) – 1 = -1
Чтобы нормализовать второе значение 16 , мы будем использовать ту же формулу:
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((16 – 13) / (71 – 13)) – 1 = -0,897
Чтобы нормализовать третье значение 19 , мы будем использовать ту же формулу:
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((19 – 13) / (71 – 13)) – 1 = -0,793
Мы можем использовать ту же самую формулу для нормализации каждого значения в исходном наборе данных между -1 и 1:
Каждое значение в нормализованном наборе данных теперь находится в диапазоне от -1 до 1.
Используя этот метод нормализации, следующие утверждения всегда будут истинными:
- Нормализованное значение минимального значения в наборе данных всегда будет равно -1.
- Нормализованное значение максимального значения в наборе данных всегда будет равно 1.
- Нормализованные значения для всех остальных значений в наборе данных будут находиться в диапазоне от -1 до 1.
Когда нормализовать данные
Часто мы стандартизируем переменные, когда проводим какой-либо анализ, в котором у нас есть несколько переменных, измеренных в разных масштабах, и мы хотим, чтобы каждая из переменных имела один и тот же диапазон.
Это предотвращает слишком большое влияние одной переменной, особенно если она измеряется в разных единицах измерения (т. е. если одна переменная измеряется в дюймах, а другая в ярдах).
Также обратите внимание, что метод нормализации, который мы использовали здесь, является лишь одним из возможных вариантов.
В некоторых случаях имеет смысл нормализовать переменные между 0 и 1 или даже между 0 и 100.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие типы нормализации:
Как нормализовать данные между 0 и 1
Как нормализовать данные от 0 до 100